P. 1
Regressão de Cox - COMO FAZER

Regressão de Cox - COMO FAZER

5.0

|Views: 4.792|Likes:
Publicado porAugusto Augusto

More info:

Published by: Augusto Augusto on May 31, 2012
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

10/26/2014

pdf

text

original

Regressão de Cox

Visão global
Regressão de Cox, que implementa o modelo de riscos proporcionais ou modelo de duração, é projetado para análise de tempo até que um acontecimento ou de tempo entre eventos. uma ou mais variáveis preditoras, covariáveis chamados, são usados para prever um estatuto (do evento) variável. A análise univariada exemplo clássico é o tempo de diagnóstico de uma doença terminal até que o caso de morte (daí a análise de sobrevivência). regressão de Cox também é utilizado para a adopção de políticas / estudos de difusão (ver Jones & Branton, 2005). A saída central de estatística é a razão de risco. Observe que ao contrário dos modelos paramétricos discutido na secção sobre a história de modelos evento (EHA), regressão de Cox é semi-paramétricos e não requer do pesquisador para especificar uma taxa de risco de base ou estimar o risco absoluto. Por esta razão, a regressão de Cox pode ser preferido em relação aos modelos paramétricos EHA quando não há nenhuma razão clara teórico para postular uma relação de risco particular de base. Na maior parte dos casos, não há motivo tão forte, clara e os pressupostos mais rigorosos de dados de modelos paramétricos EHA não se justificam, tornando os modelos de Cox a melhor escolha. Stata é o pacote de software preferido para Cox de regressão e análise de sobrevivência. Além Stata, Limdep é outro pacote estatístico com amplo suporte para os modelos de história do evento, incluindo os modelos de Cox. No Stata, declarar os dados com o comando stset, em seguida, executar a regressão de Cox com o comando stcox. Para a regressão de Cox ordinário em SPSS (ex-SPSS), Analisar seleccionar, de sobrevivência, regressão de Cox, entra a variável tempo, introduzir a variável covariáveis (s); inserir a variável de estado (a variável evento) e definir eventos para especificar o valor da ocorrência (ex., a morte = 1), em Opções você pode querer verificar que você quer 'Mostrar a função de base "para obter o efeito de tempo apenas para comparação com os efeitos covariável. regressão de Cox é um modelo específico dentro da categoria mais ampla de análise da história do evento. Para o tratamento

Conteúdo Principais conceitos e termos adequação do modelo Modelos A regressão de Cox Estratificada de regressão de Cox Regressão de Cox na Stata Regressão de Cox no SPSS / SPSS Estatística Pressupostos SPSS / saída SPSS Perguntas mais frequentes Bibliografia

relacionados importante, ver a discussão em separado do histórico de eventos métodos. Veja também a discussão em separado de Kaplan-Meier , um procedimento para estimar funções de sobrevivência e risco, mas não efeitos covariável. Veja também as tabelas de vida procedimento, utilizado para descritivo, estudos atuariais de duração onde o tempo é a única variável salientes e censurada e casos de censura não diferem.

Termos e Conceitos Fundamentais
o

Variáveis  variável de estado. Também chamado de evento ou censura variável, a variável de estado é o dependente na regressão de Cox. O exemplo clássico é a morte variável binária em estudos médicos, com a morte igual a 0 ou 1 para sobreviver à morte. No entanto, o pesquisador pode atribuir um intervalo de valores ou uma lista de valores para o evento "condição", que não tem de ser "1". A variável status é analisada em relação a uma variável de tempo (veja abaixo) ou com risco de taxa de sobrevivência é a saída central de regressão de Cox. Em um estudo de adoção de política como o evento de status, de regressão logística se concentrará na análise da variância (o logit da) a adoção, no momento da coleta de dados. Em contraste, a regressão de Cox na análise centra-se a probabilidade de aprovação em qualquer período de tempo. Porque além de conjuntos históricos não se sabe o estado final para todas as observações ou o tempo para alcançar o status final, dados censurados e conter casos de censura, que é compatível com os pressupostos da regressão de Cox, mas não com os de regressão logística.  variável tempo. O tempo de duração variável de medidas para o evento definido pela variável de estado. A variável tempo pode ser discreto ou contínuo. Normalmente, o "tempo" variável é um contador simples de unidades de tempo desde o início da série. Se o tempo é medido por uma variável de contador em unidades de tempo, o modelo de Cox assume que o risco aumenta linearmente com o tempo, à condição de co-variáveis no modelo. É possível, entretanto, para a variável tempo para ser logarítmica ou alguma outra função do contador. A significância ou não significância de covariáveis do modelo pode variar de acordo com o tipo de tempo variável utilizada. Unidades menores intervalos de tempo, proporcionar mais tempo, o que aumenta a potência dos modelos Cox (menos chance de um erro de Tipo II: pensando que não há relação entre as variáveis dependentes do modelo, quando na verdade não existe).  Análise do tempo é uma variável de tempo, onde t = 0 é o tempo de início do risco. Aparecimento de risco significa quando a falha (ou o "evento"), primeiro torna-se possível. Tempo de análise é rotulado de "t", ao passo que o "tempo" é usado quando 0 tem outros significados, tais como início da medição. A origem "é o" tempo "quando o tempo de análise, t = 0. Assim, t = tempo - origem. É possível que o tempo = t, se o evento (ex., a adoção) é possível de imediato, desde o início da medição, mas nenhum caso ainda não foram efectuadas do evento (none adotaram). Stata pressupõe tempo de análise e t = tempo padrão. No entanto, se a variável tempo no conjunto de dados não refletem sendo 0 o início do risco, mas há uma origem diferente, a origem da função Stata () pode ajustar a variável tempo de ser uma variável de tempo de análise. Além disso, a escala () função pode ajustar o intervalo de tempo para ser o que é conveniente para a análise (por exemplo, converter dias para anos). Isto é feito no Stata usando o comando stset, discutido mais adiante na seção sobre "os dados em tempo de sobrevivência (dados r)".

Covariáveis são o preditor / variáveis independentes em um model.Covariates Cox pode ser categórico (ex. sexo, raça ou contínua (ex. renda, idade). Covariates também pode ser um tempo fixo ou tempo-dependente, uma diferença que afeta a forma como a covariável é modelado em procedimentos Cox. Por exemplo, "contiguidade", (ex., codificadas 0 ou 1 para indicar se um estado era contíguo a um determinado estado ou não) seria em tempo fixo. "renda familiar média", que alterações por ano, seria tempo de variável (dependente do tempo).  Covariáveis dependentes do atraso de tempo. Recomenda-se (ex., Box-Steffensmeier & Jones, 2004: 111) que covariáveis dependentes do tempo de inscrição no formulário defasados. Isso é para evitar simultaneidade de causa e efeito. A covariável é visto como uma causa do evento, mas se altera o valor literalmente, ao mesmo tempo que o evento ocorre, a lógica de causa-efeito é perdida mesmo que o novo valor da covariável é incorporado na taxa de risco. Além disso, quando a medição do tempo do evento é impreciso, ficando ajuda a garantir que as mudanças no tempo-dependente preceder covariável eventos.  Centralizador. Se o pesquisador estará analisando as taxas de risco de base, os dados devem ser centradas covariável (subtração da média) para que eles tenham um ponto zero natural. Caso contrário, as taxas de risco de base, que são as taxas de tempo apenas quando todas as co-variáveis são zero, estão estimados para os pontos que não existem no conjunto de dados, resultando em funções de risco enganosas de base (ver Box-Steffensmeier & Jones, 2004: 65) . covariáveis categóricas são variáveis explicativas que podem ser utilizados em regressão de Cox. SPSS / SPSS irá convertê-los automaticamente em um conjunto de variáveis dummy, omitindo uma categoria, como é usual (por padrão, a última categoria, embora o SPSS / SPSS permite especificar manualmente a primeira vez). Cada variável dummy terá seu próprio coeficiente de regressão. Não é necessário especificar como covariáveis categóricas dicotômicas que já estão codificados indicador (0,1) a menos que o investigador deseja para especificar grupos para fins de parcelas. A interpretação deste coeficiente depende do tipo de esquema de codificação: 1. Indicador ", aka codificação dummy", é o padrão: coeficiente de regressão compara o efeito do manequim com a categoria de referência (a categoria omitida das covariáveis categóricas, geralmente a última categoria - o SPSS / SPSS permite ao usuário especificar ou Apelido como categoria de referência). 2. Desvio: O efeito de cada categoria, exceto a categoria de referência é comparado com o efeito médio de todas as categorias. 3. Repetida: O efeito de cada categoria é comparado com a categoria seguinte, exceto para a última categoria. 4. Diferença: Cada categoria diferente da primeira é em relação ao efeito médio de todas as categorias anteriores. 5. Helmert: Cada categoria diferente da do passado é comparado com o efeito médio de todas as categorias subseqüentes. 6. Polinomial: As categorias são tratados como igualmente espaçados ea covariável é transformado, quadráticos e cúbicos componentes linear, etc O "categóricas codificações variável" documentos tabela os códigos reais aplicados e é útil quando há necessidade de lembrar que a categoria de referência é omitida.

Data de instalação e exemplo. Setup Os dados são discutidos abaixo. Na figura abaixo, o exemplo como implementado no SPSS / SPSS está prevendo tempo para a ratificação da Constituição E.U.. (SPSS / SPSS dados podem ser transferidos para o Stata simplesmente usando Arquivo, Salvar Como, a partir dos menus e selecionar uma das opções Stata para criar uma. Dta arquivo).

A variável status é "Status" e equivale a 1 para todos os estados uma vez que não há censura casos (todos os treze estados finalmente ratificado a Constituição). A variável tempo é "Days", de medição em dias o tempo que levou a aprovação da Constituição até a determinado estado ratificou. Outras variáveis são fatores ou categóricas (ex., o tamanho do estado: covariáveis pequeno, médio ou grande) ou contínua (ex., por cento que a votação para a ratificação passado) ou dichotomouse covariáveis (ex., se o Estado foi um centro de Bill of Rights de pressão).

Stata instalação. SPSS Embora os dados podem ser exportados diretamente para uso Stata, Stata, note que tem duas etapas necessárias antes de emitir o comando stcox de regressão de Cox.  Declarações. Deve-se usar o comando stset para declarar o tempo de análise e variáveis de incapacidade. No exemplo abaixo, o comando é "Dias stset, falha (Status)". Isso faz com que Dias variável tempo e Status da variável fracasso. Para este exemplo, todos os casos, ter um status de 1, onde 1 indica falha (que neste exemplo significa a ratificação da Constituição: "falha" é o evento de interesse, se o evento é normativamente positivo ou negativo).  variáveis Dummy. Considerando que o SPSS / SPSS criará variáveis dummy automaticamente se uma variável é declarada categórica categóricas processando o botão (veja a figura acima), isso deve ser feito explicitamente no Stata. No exemplo desta seção, há uma variável "Tamanho", para o tamanho do Estado, a partir de 1 = pequeno estado para estado 3 = grande. O código Stata "tabular Size, gen (tamanhos)" a seguir cria as variáveis dummy sizes1, sizes2 e sizes3 da variável tamanho. Mais tarde, no comando stcox, sizes1 sizes2 e são utilizados como indicadores, com sizes3 ser omitidos como categoria de referência. Os cálculos resultantes da razão de verossimilhança e os coeficientes de risco são, então, o mesmo para Stata e / SPSS SPSS.

observações truncadas. a observação "censurada" é censuradas à direita. . Um caso é da esquerda censurada no momento da falha / evento é conhecido apenas por ter ocorrido antes do tempo t. até um determinado período de tempo. Um caso é censuradas à direita quando o tempo da falha / evento é conhecido apenas por ter ocorrido após t. geralmente porque não (o evento ocorre) para que no período de tempo determinado. são medidos. Salvo disposição em contrário. um caso de direito censurado é um evento para o qual a censura (a indicada pela variável de estado) ainda não tinha ocorrido no final do período de medição.   Esquerda observações censuradas. Observações  Observações censuradas à direita. em seguida. são aquelas que não mensurada em todos os períodos de tempo. (Nota casos direita truncado são as mesmas observações censuradas à direita).That tempo é. também chamado de-truncado casos esquerdo.

A função de sobrevida cumulativa é a percentagem de casos que sobrevivem até um determinado ponto do tempo (por exemplo. que são VotePct (cento favorecendo ratificação. controlando o tempo. A função de sobrevida de base é a percentagem que iria sobreviver com base no tempo sozinho. os relatórios de resultados de regressão de Cox geralmente foco em funções de risco. O SPSS / SPSS exemplo acima gráficos das probabilidades acumuladas esperada de um estado. no entanto. O coeficiente de regressão padronizado (s) da covariável (s) é / são uma medida da importância relativa da covariável (s) para a sobrevivência. que está na média dos variáveis preditoras. Como razões de risco se prestam a uma discussão mais intuitivo. tendo o número de dias reflete no eixo X antes da votação para a ratificação da Constituição. para quando o conjunto de dados foi coletada). Funções  As funções de sobrevida. para um estado hipotético. A função de sobrevivência covariável é a percentagem que iria sobreviver dado a covariável (s). entretanto. Nota testes de significância podem mostrar uma covariável não é significativa. . refletindo a tensão dos votos) e tamanho (estados pequenos e médios contra a categoria de referência dos grandes Estados).

a sobrevivência de comando postestimation" após o comando real de regressão de Cox.  riscos proporcionais. Baseline basesurv ()... A taxa de risco é a probabilidade instantânea de determinado evento (por exemplo. escrito em folhas de cálculo como a "função exp (b)". A taxa de risco é calculado como base o logaritmo natural e elevado à potência de b: e b. como nos estudos de difusão de tempo para aprovação. taxas de risco são apresentados graficamente em um gráfico da função de risco. tratamento = 1). Em estudos industrial o perigo poderia ser avaria do motor. mas em breve:  taxas de risco. 1 (ex. De qualquer forma. a taxa de risco é a relação entre a taxa de risco dado um aumento de uma unidade na covariável para a taxa de risco sem esse aumento. controlando por outros preditores no modelo. Para uma covariável contínua. o grupo de tratamento) para a taxa de risco de outro grupo (ex. que deve incluir o basesurv "()" comando para criar uma base variável função de sobrevivência. O modelo de Cox não diz nada sobre a forma absoluta da curva formada por duas taxas de risco ao longo do tempo. . a taxa de risco é a estimativa da relação entre a taxa de risco em um grupo (ex. Ou seja. Um pressuposto fundamental do modelo de riscos proporcionais de Cox é: a taxa de risco permanecerá constante ao longo do tempo. O "perigo" é o evento de ocorrência de interesse. onde o perigo é a adoção da inovação. a taxa de risco é uma medida de tamanho de efeito para avaliar o sentido ea importância do efeito de uma variável preditora do risco relativo do evento. só que a sua relação será constante. Para uma covariável codificados 0. o papel das variáveis preditoras é avaliado mais por olhar razões de risco de olhar para os coeficientes b Cox de regressão. o risco pode ter um significado positivo. o grupo placebo).   Riscos. a sobrevida dada através de todos os intervalos de tempo antes.Stata dá um gráfico similar usando o stcurve ". Em estudos de medicina o risco pode ser a morte. No entanto..  As relações do perigo. aqui chamado de "base": stcox VotePct Direitos sizes1 sizes2 . taxas de risco e taxas de risco são discutidas mais adiante. placebo = 0. a morte = 1 em um estudo médico) que ocorrem em um determinado período de tempo.

modelos de Cox não assumimos nenhuma distribuição específica para a forma da função de risco. mas sim uma ordenação simples de tempos de falha. é necessário especificar a forma assumida da função de risco. A escolha do método de desempate raramente afeta os resultados substantivos. um dos métodos exatos podem ser selecionados. Para uma descrição mais pormenorizada do Breslow e outros algoritmos. exactm e exactp. não apenas o efeito das variáveis independentes (covariáveis). é difícil generalizar estas estimativas para outras configurações. O método de tratamento de laços pode ser definido pelo pesquisador em SPSS / SPSS e outros softwares. O método padrão (em SPSS / SPSS. não que eles são os mesmos ao longo do tempo. por exemplo. O método Efron é considerado mais preciso do que Breslow quando os laços são poucos. mas sim um método de máxima verossimilhança parcial que requer apenas a ordem dos tempos de falha não." Ou seja. em contraste. três outros métodos estão disponíveis: o método Efron. Baseline taxa de risco. modelos paramétricos. Stata e SAS) é o método de Breslow. as estimativas Cox da taxa de risco de base pode ser considerado overfitted. o controle de tempo). concentrando-se na previsão da taxa de risco. Quando os laços são numerosas. Para lidar com o fato do mundo real que existe amarrado vezes falha. Idealmente. algoritmos de probabilidade parciais foram adaptados para lidar com laços. Note também que as taxas de risco não são relações de risco e suas respectivas interpretações diferentes (isto é uma confusão em uma parte da literatura existente utilizando regressão de Cox). . As encostas das taxas de riscos proporcionais para os dois grupos pode ser para baixo. verossimilhança parcial e por modelos de Cox são semi-paramétricos. [opções]. A diferença entre o modelo de referência eo modelo com covariáveis mostra o efeito das covariáveis do modelo. No entanto. efron. o risco de base é tão intimamente ligado ao dos dados observados. modelos de Cox não usar a estimativa da probabilidade máxima. e não na razão de risco de base. a sintaxe do comando geral Cox de regressão é: stcox [varlist] [se] [no]. paramétricos evento análise histórico modelos ainda podem ser preferidos. tais como exponencial ou log-linear de eventos modelos de análise da história.  Note-se que riscos proporcionais significa que os riscos são proporcionais ao longo do tempo. Quando o investigador refere a dependência de tempo tão importante. "porque a estimativa de Cox. indicando redução de risco ao longo do tempo. os métodos de verossimilhança parcial não teria dados vinculados. tempos de sobrevivência real não são utilizados na estimativa da probabilidade parcial da função de risco. Atenção: BoxSteffensmeier & Jones (2004: 89 nota). Isso é discutido mais abaixo . A taxa de risco podem ser divididos em risco a relação inicial (dependendo do tempo sozinho) e da covariável índice de risco (em função da covariável (s). consulte Caixa de Steffensmeier & Jones (2004: 54-58).  Manipulação vezes falha vinculados. os intervalos entre os tempos de falha. para além do método de Breslow. o método da verossimilhança marginal exato eo método da verossimilhança parcial exato. isto pode ser irrelevante. As opções para os quatro métodos de tratamento disponíveis são os laços de Breslow. No Stata. será conhecido quando a estimativa do índice de risco. O método de Breslow é adequada quando existem poucos laços. Uma vez que os pesquisadores utilizam modelos Cox são enfocadas principalmente em razão de perigo da co-variáveis.

em um modelo de vida determinado tipo de gerador elétrico ou rolamentos de esferas e dada carga elétrica. na seção sobre a produção estatística. ea taxa de risco de rolamentos é 0. maior o perigo. Interpretando taxas de risco são discutidas abaixo . menor o risco. mas não diz quanto mais rápido ou mais lento (embora não seja raro na literatura para encontrar a taxa de risco interpretado dessa maneira). intervalos de confiança a alta ea baixa na taxa de risco incluíram rolamentos 1. A taxa de risco indica a probabilidade de um evento que ocorre mais rápido ou mais lento dado alguma covariável (s). isto significa que vai do velho para o novo estilo rolamentos reduziu o risco de o gerador não. no entanto. se "rolamentos" = 0 para o estilo antigo e rolamentos = 1 para o novo estilo.  Hazard ratio com covariáveis .06 é a variação proporcional em perigo quando os rolamentos da variável aumenta em 1 unidade (ou seja. vai de 0 velho estilo para um novo estilo). controlando a carga. não poderíamos ter certeza de um nível de confiança de 95% rolamentos que . Hazard ratios abaixo de 1.0. Se. Assim.Como ilustrado acima. a base de risco cumulativo para o modelo de interceptar e só o risco cumulativo na média de covariáveis no modelo completo é apresentado no "Survival" Tabela de SPSS SPSS output /. Isso é discutido mais abaixo . na seção de estatísticas.06.0 indicam que o mais covariável. Exemplo.0 indicam que quanto maior a covariância. A taxa de risco de base representa o efeito da variável tempo sozinho. A taxa de risco de 0.. Hazard ratios acima de 1. quando todas as covariáveis (s) = 0.

realmente fez a diferença. stcurve. aqui chamado baselinech: ex. a função de risco covariável parecido com este: Um gráfico similar é gerado pelo Stata. Para o mesmo modelo. este é gerado pelo comando postestimation ". . como ilustrado acima para a função de sobrevivência covariável. mostrada abaixo. O comando antes de regressão Cox deve ter solicitado o creastion de uma variável de risco de base acumulada. "Stcox VotePct Direitos sizes1 sizes2. cumhaz". basechazard baselinech ()". No Stata.

o sexo um grupo = É mais provável que incorrer o evento).59 aumentar a taxa de risco por um fator de aumento de 2. não de probabilidade) como uma pessoa no grupo placebo de ser curado no incremento da próxima vez. basehc" (baselinehc).59% = 159. aqui baselinehc: "stcox VotePct Direitos sizes1 sizes2. A taxa de risco de 1.12 significa que há um aumento de 12% na taxa de ocorrência de um aumento de 1 unidade na covariável. Para variáveis no tempo covariáveis contínuas. Por exemplo. podemos dizer que uma pessoa no grupo de tratamento que sobreviveu a um determinado momento tem três vezes mais chances (odds sentido. Onde a covariável é uma variável dicotômica agrupamento. Por exemplo.1 para a covariável idade significaria que um aumento de um ano de idade estaria associada com um 0.    Para o tempo-invariante covariáveis contínuas. A taxa de risco de 1. e uma taxa de risco calculado de 3.Compare isso com o gráfico da função de risco em si (não cumulativo). Este comando requer o comando stcox antes usar o basehc (opcional) para definir uma variável baseling função de risco. controlando para outras variáveis no modelo. se a relação for superior a 1.. a taxa de risco é a quantidade a taxa de ocorrência mudanças para uma unidade de mudança no tempodependente da função da covariável.05 significa que para um aumento de 1 unidade na covariável. A taxa de risco para nãotempo-variando covariáveis é a quantidade de mudanças no risco da ocorrência de cada unidade de mudança na covariável. uma vez que o evento não curou 0/healed = = 1.1 (10%) aumento na taxa de risco. podemos também dizer que por uma chance de 3:01 uma . como o sexo. em perigo".0.1 = 10 = 2. o placebo covariável = 0 / tratamento = 1. um hazard ratio de 1. a taxa de risco para o sexo = 1 está na comparação com o grupo do género = 0 (ex.0. Dez aumento de anos de idade que corresponde a 1. como abaixo foi gerado com o comando postestimation Stata "stcurve. há um aumento de 5% na taxa de risco da variável evento que está sendo estudada. Uma vez que a taxa de risco é uma constante. Para covariáveis binário.

Por exemplo. não reeleito = 1. Tábuas de Vida.. 2004). a AIC.0. ea taxa de risco e seu erro padrão para cada intervalo de tempo. Se inferior a 0. não 0. proporção que encerra." para o "estado republicano covariável = 0. nem o tempo de cicatrização é cortado em um terço. as proporções cumulativas. o risco de apenas relativa." a taxa de risco de 1. Pela mesma razão. . O coeficiente exponencial é a razão de risco e é interpretada em relação ao 1. tabelas de vida de usar para analisar as taxas de risco para o abuso de crianças em termos de tempo de descarga de um programa de serviços sociais. Como segundo exemplo. Unrau & Coleman (2006). Tabelas de vida. índices medianos. Sobrevivência.  Os intervalos de confiança pode ser calculado em torno de uma taxa de risco. outras medidas de tempo podem ser utilizados para avaliar a magnitude do efeito sobre o tempo de duração. mas não faz parte do SPSS / SPSS 's módulo Cox são tabelas de vida . nem que três vezes mais pessoas tratadas serão curadas por um determinado tempo (veja Spruance et al. a proporção de sobrevivência. a relação entre o tempo de cicatrização médio entre pastilhas de zinco e os grupos placebo losango seria medir o efeito das pastilhas de zinco sobre o tempo de duração absoluta. acessado em SPSS / SPSS selecionando Analisar. Relacionados. e análise de resíduos é discutida na seção sobre análise histórico evento .pessoa no grupo de tratamento é mais provável que alcance o estado de cura de uma pessoa em um grupo placebo. as taxas de risco de não avaliar os efeitos absolutos. Isto equivale a dizer que há 60% (05/03). Tabelas de vida. sugerindo a aplicação da política a ser decisivo quanto tempo após o término do programa para agendar o acompanhamento social dos trabalhadores visitas. as taxas de risco são também muitas vezes interpretada como a probabilidade de ocorrência de um determinado caso. o estado democrático = 1. risco está diminuindo e aumentando a probabilidade de sobrevivência como covariável que diminui. A relação dos tempos mediana é o candidato óbvio para tal medida. coeficientes de risco de covariáveis Quando o coeficiente de regressão unexponentiated para a função de risco covariável é maior do que 0 para uma dada covariável. o número de destino.5:1 (ou 3:2) de não ser reeleito no tempo t +1. em perigo (sobrevivência ou não) está aumentando enquanto que os aumentos covariável. Porque a taxa de risco relativo.5 significa que um governador de um estado democrático que foi no escritório de tempo t tem uma chance de 1. Não podemos dizer que a pessoa tratada vai curar três vezes mais rápido. o número de expostos ao risco. oportunidade que a duração no cargo até o caso de reeleição não vai ocorrer mais cedo por um governador de um estado democrático em comparação com um em um estado republicano. estão entre os meios para calcular tempo médio de uso em proporções medianas. mas não mostra efeito absoluto. Uma vez que um caso com o menor tempo para o evento é mais provável que incorrer o evento. em comparação com um governador de um estado republicano. por exemplo. para o evento "governador reeleito = 0. Modelos.    o o Modelo de ajuste usando a razão de verossimilhança. em um estudo do efeito de pastilhas de zinco sobre a duração do resfriado comum. A tabela a vida lhe dará o número de entrar e sair da piscina de risco em qualquer intervalo de tempo. Este também é o mesmo que dizer que há um 04/03 = 75% de chance da pessoa no grupo de tratamento será curado em primeiro lugar. discutido abaixo. Vários modelos de regressão de Cox existem para caber vários conjuntos de pressupostos de dados / situações. como discutido acima.

Fragilidade do modelo modelos o efeito fragilidade como um efeito aleatório. covariáveis são constantes ao longo do tempo por um determinado assunto / observação (ex. Tempo variando covariáveis podem ser continuamente variável (ex. . continua a ser a mesma para diferentes covariáveis tempo.. Para verificar a dependência do evento. modelos de fragilidade face à situação em que o mesmo indivíduo pode enfrentar o perigo mais uma vez.) Se a estimativa de variância fragilidade é significativo em um modelo de fragilidade condicional. os coeficientes para as variáveis medidas são menos tendenciosos. Assim. Quando depdendence evento é apresentar. em nenhum padrão estabelecido). será o mesmo. o comando verifica stvary para ver se são covariáveis constante de tempo ou tempo-dependente. Análise selecionar. ao explicar o caso.. sobrevivência. modelos de fragilidade pode ser mal se tendenciosa fragilidade está correlacionada com as co-variáveis (Hausman. Condicional modelos de fragilidade. alguns assuntos podem ser mais prováveis do que outros a experiência repetida perigos. Fragilidade modelos são suportados pelo Stata . Cox w / dependente do tempo de covariáveis. mas o efeito varia de acordo com a magnitude da variável.. No SPSS / SPSS. Isto é. cada vez que uma mudança significativa no valor covariável. onde os modelos de fragilidade condicional foram personalizados programados na linguagem R . é claro.  Evento dependência existe quando enfrentando o evento um momento anterior afeta a probabilidade de experimentar o evento um momento posterior. o rendimento pode subir. mas também entre os perigos saltos são proporcionais. depois heerogeneity observado afeta o modelo de dependência. devido a alguma causa não mensurável e talvez desconhecido (ou seja. No Stata. 1995). modelos de fragilidade. etc. duas para o segundo. sexo = 1 ou driverstatus = 1). mas só dentro dos blocos de tempo formado por mudanças nas covariáveis. mostrando que os casos são os mais frágeis. a diferentes estratos irá mostrar claramente diferentes curvas de risco cumulativo em função de modelos padrão Cox. Estudos de simulação de BoxSteffensmeier & DeBoef (2006) demonstraram a superioridade dos modelos de fragilidade condicional em relação aos modelos padrão de fragilidade em condições de dependência do evento. Nestes modelos. A fragilidade é assumida ser constante ao longo do tempo. regressão de Cox.    constante de modelos de regressão de Cox-Time. mas não pelo SPSS / SPSS. b. modelos de fragilidade condicional modificar modelos de fragilidade para ajustar para a dependência do evento. há um "salto" para cima ou para baixo em perigo. estratificando-se pelo número de eventos. modelos de fragilidade são análogas às de regressão com efeitos aleatórios. que o pesquisador deve especificar. No Stata. DeBoef & Joyce (2007). e executa o comando stcox regressão de Cox. independente das covariáveis. O coeficiente de regressão. ou ir para baixo do período de tempo ao tempo período.. o comando stcox é usado em conjunto com a TVC (varlist) opção de declarar variáveis no tempo covariáveis. Análise selecionar. uma covariável varia ao longo do tempo e pode haver constante covariáveis também. a causa da "heterogeneidade não observada"). parcela do risco cumulativo de y por x tempo. Riscos ainda são proporcionais ao longo do tempo. levantando a possibilidade de que. Ao estimar a fragilidade como uma causa da heterogeneidade não observada como um efeito aleatório. modelos de fragilidade condicional estratificar casos por número de eventos (1 para a primeira experiência do evento. No SPSS / SPSS. Survival. dependente modelos de regressão de Cox-Time. esta opção suporta tipos de terrenos e de poupança das variáveis de diagnóstico não está disponível no modelo tempo-dependente. Esta probabilidade é a fragilidade "do assunto e nos modelos padrão Cox é um efeito desmedido. Veja também BoxSteffensmeier. Além disso. o efeito de fragilidade (nu) é estimado e pode ser plotado no eixo y contra caseid no eixo x. aumento da idade de 1 unidade cada vez que aumenta o tempo t em 1) ou pode ser discreta variação (ex. Nestes modelos. 1978) ou a distribuição de errado é assumido (Blossfeld & Rohwer. e ser elaborada a partir de uma determinada distribuição (geralmente de gama). No SPSS / SPSS. Isto significa risco relativo (razão de risco observado à linha de base) varia ao longo do tempo.

A estatística de contagem é utilizado pelo SPSS / SPSS como critério de entrada. são direcionados para situações onde os eventos de repetição. Alguém poderia fazer isso. uma "perda do quiquadrado" estatística é calculada em cada etapa. ou a estatística de Wald. então pelo menos uma das variáveis no modelo em que ponto é significativa. modelos concorrentes riscos tratar razões diferentes como diferentes eventos. Para qualquer determinada variável. mas pode ser implementado como modelos de Cox também. permitindo a comparação das funções de risco em riscos competitivos. No passo a passo para trás. Stata mas não SPSS / SPSS suporta modelos repetidos eventos. mas mais rápido computacionalmente). em qualquer etapa. Como em outras formas de regressão. eventos repetidos são discutidas mais adiante na seção de análise de histórico de eventos .10.Log parcelas de sobrevivência. Este critério de remoção é geralmente baseada na razão de verossimilhança com base em estimativas de máxima verossimilhança parcial.05 ou menos. pode-se usar o would-be variável estratificação como covariável. em qualquer etapa.  "Omnibus Testes de modelo de coeficientes" tabela usa-2LL para testar a mudança a partir da etapa anterior.  critério de entrada. claro. Se a importância global é 0. onde está a remover uma variável de cada etapa. a variável (s) acrescentar a este bloco é / são significativas. Se a mudança de significado bloco anterior é 0. refletindo a contribuição das variáveis para o modelo. mas o usuário pode selecionar. Em cada etapa. na seção sobre "Parcelas"). a variável adicionada em que etapa é significativo. tais como ataques múltiplos com uma doença e cura para os doentes. Se o residual do qui-quadrado significativo. irá obter um perigo funções distintas de base para cada valor da variável categórica.  eventos modelos repetidos. se o significado da mudança> 0. também chamado de "múltiplos destinos" modelos. Porque é preciso assumir os mesmos efeitos em todas as categorias. em vez da razão de verossimilhança com base em estimativas de parâmetros condicionais (semelhante. que não foram proporcionais (se fosse proporcional. o residual do qui-quadrado é calculado e exibido nas variáveis "Not in a equação" da tabela. na terminação de guerras pode ocorrer através da negociação ou a derrota. Por exemplo. Competindo modelos de riscos. se pensava que tinham funções diferentes categorias de base diferente. em cada etapa. Stata mas não SPSS / SPSS suporta modelos concorrentes riscos. Ao entrar covariável categórica no "Strata" caixa de diálogo de regressão de Cox no SPSS / SPSS. métodos para a inserção de variáveis independentes (as covariáveis ). Se a mudança de significado etapa anterior é 0. também chamado de "episódio vários" modelos. os métodos stepwise adicionar a variável com maior pontuação significativa.05 ou menos. caso contrário esta será a mesma da etapa anterior). mas pode ser implementado como modelos de Cox também. em qualquer etapa. Além disso.05 ou menos. são dirigidos a situações em que o evento terminal pode ocorrer mais de uma razão. a variável é removida se o significado da perda do qui-quadrado é maior do que 0. ou a mudança do bloco anterior (se a entrada de bloco é usado. modelos de riscos competitivos são discutidas mais adiante na seção de análise de histórico de eventos . regressão de Cox suporta "stepwise". apenas um conjunto de coeficientes agrupados são . bem como "enter" (todas as variáveis do modelo entrou em uma etapa) e "block" (variáveis entrou em blocos especificado pelo usuário). o Regressão de Cox estratificado.10. o A regressão de Cox.  critérios de remoção na regressão "Se o mandato Removido mesa". a variável com a estatística de maior pontuação não nas variáveis "na equação de mesa" é a próxima a ser inserido na etapa seguinte. ot vários períodos de paz e de guerra para as nações. discutidos abaixo. pelo menos uma das variáveis ainda a ser adicionado ao modelo é significativa. é convencional a concluir que a exclusão dessa variável se justifica. A cada passo. proporcionalidade pode ser verificado pela LogMinus.

O modelo é especificado da mesma.  Cox de regressão com dados censurados.  Cox de regressão com variável contínua e em tempo covariáveis. O STS gerar comando adiciona novas variáveis para o conjunto de dados baseado em risco previamente modelados e funções relacionadas.  Cox de regressão com variáveis no tempo discreto covariáveis. mais que a droga reduziu o risco de morte por câncer.0. as taxas de risco calculado que mostram o efeito da idade.  Cox de regressão simples com dados não censurados. a carga e os rolamentos são covariáveis que não variam no tempo. Para um conjunto de dados sobre a pneumonia. A Surg variável = 1 quando o paciente teve uma cirurgia cardíaca prévia. no entanto. drug2) opção declara drug1 e drug2 ser . Para um conjunto de dados sobre o tratamento do câncer. o modelo como um todo é importante. onde os dados para drug1 e drug2 são os níveis de dosagem de duas drogas. regressão de Cox é executado com o comando stcox depois de declarar uma sobrevida formato dataset tempo com o comando stset. o comando stset tempo definido como a variável tempo e curadas como variável de evento. drug2) texp (exp (-..computados para as co-variáveis (indicadores). o controle de tratamento da toxicodependência . Comando: rolamentos de carga stcox. Anteriormente o comando stset studytime definida como a variável tempo para o evento e definir a variável morreu como a variável de evento. TVC (drug1. o comando mais complexo com a TVC () e texp () podem manipular o modelo mais realista supor que o nível desses fármacos tempo é variável. drug1 ou drug2. Quanto maior a taxa de risco para a idade é acima de 1. A variável tempo até a falha é failtime.0. A tabela de saída principal irá mostrar a relação de risco. A (TVC drug1. Tivesse sido o comando idade stcox drug1 drug2. Mais cedo. O comando stcurve pode ser usado com ou stcox StrEG para produzir sobrevivência. o seu erro padrão. e id como a variável id. Se posttran = 1. discutido acima. estes pacientes ainda estavam vivos no final do estudo e constitui censura casos. controlando para a idade. dependendo se eles receberam um transplante. declarado pelo stset mais cedo e por isso não mencionados no comando stcox. são declarados no comando stcox usando o TVC (varlist) opção. 035 * _T)) nolog. Se morreu = 0. stset t1 definido como a variável tempo e morreu como o mesmo variável. Comando: idade stcox. é uma covariável posttran discretos variantes no tempo. Nas variantes de stcox discutido abaixo. o paciente recebeu um transplante e. onde drogas = 1 significa que o paciente recebeu um medicamento contra o câncer ao invés de um placebo. Há 1 ou 2 registros por paciente. Anteriormente. como os exemplos anteriores. A sintaxe do comando geral é stcox (varlist). especificamente que a quantidade da droga no organismo diminui ao longo do tempo. No entanto. se houver. Quanto mais o índice de risco calculado para a droga é abaixo de 1. como descrito acima. que permitem a comparação dessas funções entre os diferentes níveis de covariáveis.05 ou menos. mais o aumento da idade a probabilidade de morte por câncer. Todos os casos (geradores) falharam. A probabilidade de registro e sua probabilidade é também impresso. Comando: idade stcox droga. risco e parcelas risco cumulativo de funções. respectivamente. No Stata. covariáveis dependentes do tempo. Para um conjunto de dados sobre quanto tempo geradores elétricos última até a falha. Se a probabilidade de a probabilidade de registro é 0. Para o conjunto de dados de transplante de coração Stanford. ea idade é uma covariável. o Regressão de Cox Com ou Sem-Dependent Covariates Tempo em Stata. e seus intervalos de confiança. Comando: posttran idade stcox surg ano. A variável ano foi o ano em que o paciente foi aceito no programa de transplante. o seu nível de probabilidade. A variável estratificação não é tratado como um preditor e não os coeficientes são calculados por ele. portanto. Exemplos disso são a manual de Stata. cada um controlando para as outras duas. agitar e comandos ltable gerar resultados estatísticos relacionados com a análise de sobrevivência. não há ainda geradores de trabalho (sem censura casos). assumindo a níveis da dosagem de drug1 drug2 e manteve-se constante em todo o corpo do paciente ao longo do tempo. presume-se que já declarou stset / definido o conjunto de dados o tempo de sobrevivência. O STS.

Análise selecionar. A saída é similar à regressão Cox comum. ex. o mais frágil do paciente. mas diferentemente interpretado como antes. em uma segunda etapa. tendo cada caso com múltiplas falhas e criar novos processos com id novo. Neste conjunto. O modelo simples. o mais provável para enfrentar o perigo. compartilhada (paciente). Se quisermos. O modelo mais complexo com a TVC () e texp funções () dá a razão de risco para uma droga como uma função decrescente do tempo. respectivamente. ea taxa de risco para drug1 é proporcional mudança de perigo quando o nível de concentração no sangue (ou seja. egen. seguido pelo tipo de comando (nu) e nu paciente da lista. 35t)) aumenta de uma unidade. o paciente é a identificação do paciente. sem a TVC () e texp funções () dá a razão de risco para. Stata suporta estimativa convencional de matrizes de covariância-variância. Quanto maior o nu. Comando: Feminino Idade stcox. podemos testar para ver quais os pacientes são menos ou mais frágil (ou seja. <0. Tais modelos são modelos de risco não-proporcional. O parâmetro nolog suprime um registro de saída intermediária. para controlar drug1 drug2 e idade.. Basta adicionar uma vírgula seguida de forte após a varlist stcox. um efeito significativo nível do paciente. ou seja. Alternativamente. Isso é feito com o stgen. Isso cria uma tabela do paciente. com a fragilidade compartilhada presumido. Podemos querer analisar os dados em que o evento de interesse pode ocorrer mais de uma vez para o mesmo caso. sexo = 1 não varia ao longo do tempo para um indivíduo). portanto. regressão de Cox assume que os valores comuns de qualquer observação dada sobre cada covariável não variam ao longo do tempo (ex. Isto seria feito com o comando feminino idade stcox. sobrevivência. controlando drug2 como uma função decrescente do tempo e da idade. "churchattendancerate" da pessoa com CaseID = 437 é a mesma em cada período de tempo. No SPSS / SPSS. mas as tabelas de saída são praticamente os mesmos e interpretado o mesmo. onde _t = t = tempo de análise . vce (bootstrap). com cada um tendo duas inserções (em épocas diferentes) e. compartilhada (paciente) efeitos (nu). e três outras alternativas usuário especificáveis. mas as funções de risco são calculados de forma diferente e os grupos de saída do co-variáveis em conjuntos não-tempo-dependente e tempo-dependente. Cox de regressão com dados de falhas múltiplas. e uma taxa de risco é a variação proporcional em perigo quando o nível de dosagem de drug1 aumenta em 1 unidade. mas não é usado como uma variável id convencional. e stset comandos como descrito no StataCorp (2005: 136-138). o Regressão de Cox Com e Sem-Dependent Covariates Tempo em SPSS / SPSS. 35t). mas não serão discutidos aqui. Se o teste de log-verossimilhança da teta é significativa (por exemplo.. regressão de Cox. a possibilidade de duas infecções distintas. agrupados por assunto. menos ou mais contribuem para a fragilidade do paciente-nível). Abaixo a tabela principal razão de risco. mas sim como uma variável de fragilidade compartilhada. então há um efeito significativo fragilidade (neste caso. diminuindo exponencialmente pela função exp (-. substituir. um para cada falha. gen. ser adaptado para covariáveis que variam ao longo do tempo para os mesmos indivíduos.   variável no tempo covariáveis. por padrão. As relações do perigo será computado. drug1 * exp (-. Aqui a unidade de análise é a inserção. Tipos de estimativas de variância. classificar. Um exemplo dado no manual de Stata é um experimento com a inserção do cateter e infecção subseqüente possível. nu. que é uma medida da fragilidade.05). ou vce (canivete) para o comando stcox. seu erro padrão e um teste de log-verossimilhança da teta. descrito no manual de Stata. Stata irá imprimir um valor de teta. Para obter as alternativas. . Stata suporte e isso envolve. no entanto. O texp (exp (-. Idade e sexo feminino são contínuos e dicotômica covariáveis. por exemplo. modelos de Cox pode. o add vce opções (robusta). 035 _t *)) opção especifica a função de definir o modo como as co-variáveis declaradas variáveis com o tempo mudam ao longo do tempo neste caso. Isso requer cálculo diferente. Regressão de Cox com fragilidade compartilhada. além de nível de inserção de efeitos).  Sem-covariáveis dependentes do tempo. robusto é um sinônimo para vce (robusta).

Se a variável não é sistematicamente relacionado com o tempo. T_COV_ * churchattendancerate). clique no botão Model para entrar a variável tempo. o Estatística  taxa de risco. a Time 4: (T_ <1) * CA1 + (T_> = 1 & T_ <2) * CA2 + (T_> = 2 & T_ + <3) * CA3 (T_> = 3 & T_ <4) * CA4). Sobrevivência.0 encontra-se dentro destes limites de confiança. para obter um termo de interação em tempo covariável entrou na lista covariável. valor de p. qualquer lógica sub-expressão (ec. CA2 in Time 2. óbito = 1) e introduza o covariáveis.1.. Nesse caso. T_. Com covariáveis dependentes do tempo  No SPSS / SPSS. então um termo de interação é criado com o tempo (ex. a característica não tem qualquer influência sobre o evento. no topo da lista de variáveis. a 1 indica a presença de uma característica.  O risco relativo é a razão de risco para o caso em que a covariável é uma dicotomia. etc.. não se pode ter 95% de certeza de que a covariável tem qualquer efeito e deve relatá-lo como não-significativa.  Os intervalos de confiança em Exp (B) são produzidos pelo SPSS / SPSS e outros pacotes. Para covariáveis tempo-dependentes do tipo (2) acima. por padrão. w Cox / Time-Dep Cov . dando a inferior e superior de confiança dos limites de 95% em torno do valor da Exp (B). Como discutido anteriormente na seção de regressão de Cox simples . também chamado de "odds ratio" ou Exp (B). etc Por exemplo. controlando para outras variáveis em qualquer modelo. Caso a variável é sistematicamente em relação ao tempo (a variável T_). então o risco de morte é 1.0. você pode transformá-lo (por exemplo. a morte = 1: diminuir o tempo de sobrevivência previsto). dada a sobrevivência ao tempo t. Para covariáveis tempo-dependentes do tipo (1) acima. Segmentado covariáveis dependentes do tempo. Na caixa de diálogo 'Compute TimeDependent Cov.0. selecione T_COV_ ea covariável e clique em> o "= a * b> botão". clique no botão Colar para abrir o Editor de sintaxe. quando o seu risco relativo superior a 1. 2. e se a taxa de risco (Exp (B)) é de 1. T_/52 iria transformá-lo anual) ou deixá-lo como T_. onde você pode digitar uma expressão lógica complexa. Ordinária covariáveis dependentes do tempo. mais as variáveis aumentam as chances de o evento ocorrer (ex. uma nova variável chamada T_COV_ é criado para uso na análise.0.  SPSS / SPSS. e . Neste exemplo. ex. De qualquer maneira.  Stata:. (T_ <1) A verdade é avaliado como um e multiplicado pela variável correspondente CA. e os outros são zerados. e aumenta a probabilidade do evento.  Selecionando a opção Cox tempo-dependente insere automaticamente uma variável de tempo. vamos ser CA1 freqüência à igreja no tempo 1. o maior da covariável.1 vezes maior para fumantes do que para a luz e não-fumantes (fumantes = 0). se uma covariável é o tabagismo (0. de modo que quando codificado 0. Quanto mais acima de 1. A taxa de risco é a probabilidade de o evento ocorrer no tempo t + 1.0 indica que as variáveis no modelo não têm nenhum efeito no tempo de eventos para a variável de estado. o Estado variável (e definir o seu evento. 1). com um fumo ser pesado. então é preciso criar uma expressão lógica que relaciona a variável de tempo em cada período de tempo (ex. A taxa de risco aparece como Exp (B) nas variáveis "na equação" mesa de saída do SPSS SPSS /. Se o valor de 1. quando o seu risco relativo é de 1. define (opcionalmente transformar) em "Compute Time-Dependent Cov" caixa de diálogo.. A taxa de risco de 1. o comando stcox gera a taxa de risco. menor as chances de o evento ocorrer (aumento previsto o tempo de sobrevivência)...1. Análise selecionar.0. Quanto mais a relação de risco é inferior a 1. e se o evento é a morte = 1. juntamente com o seu erro padrão. 1. para os dados semanais..

O teste da razão de verossimilhança é preferido sobre o teste ou o teste de Wald pontuação como forma de avaliar a significância do modelo geral de modelos logísticos.. No entanto. as co-variáveis contribuem significativamente para a explicação de dias de duração dos estados. se Sig.05 (o padrão usual da ciência social). o nulo (intercepto-only) modelo tinha-2LL = 45.     Comparado com outros testes. o modelo como um todo é importante. a pontuação é usado na regressão stepwise Cox no SPSS / SPSS.012.224 (multiplicar por -2 para conseguir isso).  intervalos de confiança. A estatística de pontuação. SPSS / SPSS e alguns outros pacotes de saída também uma estatística escore (aka global.11219 corresponde ao 2LL em SPSS SPSS saída / de 32. A verossimilhança da -16. um modelo de diferença qui-quadrado de 12.88. até a ratificação da Constituição. Stata: O teste da razão de verossimilhança é gerado pelo comando stcox. então o efeito de covariáveis (s) não pode ser considerado como diferente de zero. Se-2LL é significativo. seja por razão de probabilidade qui-quadrado ou global (score) do quiquadrado. Para a ilustração acima.104. Ou seja. Significa. testes de razão de probabilidade Stepwise aparecer no "modelo de coeficientes tabela 'no SPSS / SPSS. qui-quadrado ou total do qui-quadrado) como critério de significância alternativa para o modelo. o modelo é significativamente melhor do que o modelo nulo. também chamado de teste de omnibus ou-2LL ou -2 log verossimilhança. A probabilidade estatística -2 log aparece no "-2 log verossimilhança" da tabela do SPSS / SPSS. . Interpretação do odds ratio é discutida nas seções de análise loglinear e regressão logística .012). SPSS / SPSS:. que em cada etapa adiciona a variável com o maior número de pontos significativos. também. que é o exemplo simples usado aqui . A taxa de probabilidade quiquadrado e seu significado (Prob) permanecem os mesmos em ambos os programas.> 0. Isto significa que pelo menos uma das covariáveis contribui significativamente para a explicação de duração para o evento. Adicionando o Nohr "opção para o comando stcox suprime taxas de risco e causas dos coeficientes de risco correspondente a ser impresso. Ou seja.224. Teste da razão de verossimilhança do modelo. O modelo completo tinha-2LL = 32. mas o teste da razão de verossimilhança é o teste padrão. Na figura acima. que é o modelo de tempo apenas quando todas as covariáveis são 0. o que é significativo ao nível 0. o nível de significância é a mesma (0. como ilustrado abaixo.

eo valor de significância do coeficiente.> 0.). se sig (Wald) <0. então o efeito covariável não pode ser considerado como diferente de zero.05. a pesquisadora conclui que a variável é útil para o modelo. Ou seja.  razão de verossimilhança são discutidas mais adiante na seção de regressão logística coeficientes de regressão. Se Sig. em seguida. por ex. A maioria dos pacotes que as estatísticas mostrem o coeficiente de regressão (B) para cada covariável. os graus de liberdade (df). o seu valor de significância de teste de Wald. SPSS / SPSS faz isso nas variáveis "na equação" mesa ilustrado abaixo. o erro padrão de B (SE). coeficientes de regressão positivo significa que o perigo aumenta covariável (uma maior probabilidade de que a morte = 1. .05 (o padrão usual da ciência social). enquanto os coeficientes negativos correspondem ao risco reduzido. todas semelhantes e interpretado como na regressão logística . Note-se que o teste 2LL é preferível ao teste de Wald ao testar o modelo global.

Direitos foi codificado 1 = fortemente envolvida. o que reflecte ou não o Estado foi fortemente envolvido na luta para incluir um Bill of Rights na Constituição (Direitos). os dados não são uma amostra e qualquer efeito. os dias até a ratificação da Constituição estadual está prevista a partir de diversas covariáveis. controla os direitos de VotePct. até a ratificação. quanto mais perto da votação (VotePct inferior) ou estar na maior categoria Bill of Rights (1 = muito) ambos tendem a aumentar até o dia ratificação quando considerados isoladamente. não é devida a chance de amostragem). quando consideradas em conjunto. Mas no modelo 2. com todos os 13 estados de origem dos dados. o sinal positivo do VotePct covariável no modelo 1 significa maior risco de ratificação. No Modelo 1. Ou seja. Exemplo. Na ilustração acima. (Claro. a variável Direitos torna-se significativo e controle de direitos. o que equivale a poucos dias até a ratificação. por isso o sinal negativo do coeficiente de Direitos Modelo 2 significa redução de risco (da ratificação do evento). a proximidade da votação (VotePct) é um preditor significativo. . que se traduz em mais dias. 0 = não. Da mesma forma. mas. quando um indicador binário é adicionado. não importa quão pequena. torna-se não VotePct significativa.

Odds ratio de 1. . deve-se interpretar que diz respeito à categoria de referência. antes da ratificação e.Como mostrado na figura acima.0 estão associados com risco aumentado do evento (neste caso. nenhum par de preditores é altamente correlacionadas. O odds ratio para as pequenas (1) e médio (2) estados são menos de 1. Ele é usado para verificar a multicolinearidade. A ilustração abaixo mostra multicolinearidade não é indicado para os preditores no modelo 2.0 estão associados com risco de diminuição do evento (neste caso. Odds ratio acima de 1. Assim razões odds acima de 1. Stata gera os coeficientes mesmo perigo razão por padrão (observe o Nohr "opção não é utilizada para suprimir taxas de risco em favor dos coeficientes de risco). Matriz de correlação dos coeficientes de regressão é um dos quadros do SPSS SPSS output / saída e de outros pacotes. estados pequenos e médios ratificado antes. Odds ratio abaixo de 1.0 correspondem aos coeficientes b positivo e odds ratio abaixo de 1. grandes estados tiveram mais dias para ratificar a Constituição estabelece.0 significa que o co-variável não tem efeito sobre as probabilidades associadas ao cargo. como tal. Assim. a categoria de referência). depois da ratificação e mais dias de duração). indicando que.0 correspondem a coeficientes b negativos. Stata rótulos as taxas de risco. Medium ratificado em poucos dias . portanto. Exp (B) na saída acima é a razão de chances. Idealmente.0). Exp (B) é a mudança prevista no perigo de um aumento unitário no indicador. sendo pequena ou média aumentou o risco. em comparação aos estados grandes (3.0. não ". Para covariáveis categóricas. os estados 2 = médio e 3 (categoria de referência) = grandes estados. Exp (b)" como no SPSS / SPSS. menos dia). Por exemplo.   A razão de chances. que é também a razão de risco para uma dada covariável. na ilustração acima. discutido acima. ou seja. indicado pelo odds ratio para o tamanho = 2 sendo a mais baixa (mais distante de 1. tamanho é categórica (1 = pequenos estados.

"B" aparece nas variáveis "na equação" tabela do SPSS / SPSS. o pesquisador pode concluir que pelo menos um dos coeficientes de efeito diferente de zero. Se a importância global Wald é 0. SE.. só o tempo quando todas as co-variáveis = 0. Quando as co-variáveis são categóricas. se uma variável é categórica.  .  Stata: Após a montagem de um modelo de regressão de Cox com stcox. a base da função risco acumulado é exibido para várias vezes representados como linhas. pode ser reinvoked coeficientes de regressão para mostrar um pouco do que taxas de risco: stcox. Este significado global Wald testa a hipótese nula de que todos os coeficientes para o efeito que a variável categórica é zero. "religião" (1) . Como ilustrado abaixo. em seguida. ou confiança. com taxas de risco de base interpretado como de tempo somente para as pessoas na média dos covariável (s ).  Baseline risco cumulativo é a taxa de risco para o modelo. Exp (b) intervalos.  SPSS / SPSS: O coeficiente de regressão não padronizados. Saída será muito semelhante ao padrão. taxas de risco cumulativo Baseline são mais fáceis de interpretar quando dados numéricos covariável foram normalizados (não é o caso ilustrado abaixo). fazendo com que meios covariável a zero. sobrevivência e taxas de risco cumulativo. Geralmente essa taxa aumenta com o tempo. mas terá um valor de Wald e da importância correspondente (veja abaixo). ao invés de ser uma taxa única. Baseline risco. No SPSS / SPSS e outros pacotes.05 ou menos. a religião "(2)". As variáveis categóricas..) A linha geral não terá entradas para B. cada uma com uma linha de base correspondente taxa de risco cumulativo. bem como uma linha para cada não-omissão de valor (ex. etc. mas com coeficientes substituído por razões de risco. Nohr. "religião"). haverá uma linha geral (ex. a taxa será para as pessoas na categoria "0" para cada covariável.

Matematicamente. o início do risco é a adoção da Constituição. 0 = não-fumadores ou light. representado no eixo X. Na ilustração acima. anteriormente ilustrado acima . é a sobrevivência cumulativa. com valores médios na covariável (s) a qualquer momento. no entanto. apoiada pela SPSS / SPSS e outros pacotes. os estados são as unidades de observação. então haverá uma parcela de sobrevivência acumulada para cada valor. permitindo a comparação. A coluna "Sobrevivência na saída SPSS SPSS / dá a taxa de sobrevivência estimada para a linha de tempo especificado após o início do risco do evento. O eixo Y. Neste enredo. declive parcelas de sobrevida acumulada abaixo da esquerda para a direita desde cumulativa sobrevivência diminui à medida que aumenta o tempo de sobrevivência. apoiada pela SPSS / SPSS e outros pacotes. o risco cumulativo é a negativa do registro da sobrevivência. Taxas cumulativas de perigo. por 224 dias após a aprovação da Constituição de Filadélfia. No exemplo acima. o eixo X é o tempo de . A taxa de sobrevida é o percentual estimado de casos que não tiveram o evento de interesse pela linha do tempo especificado. O perigo "cumulativa" coluna na saída SPSS SPSS / é semelhante.. também ilustrado anteriormente referido . 36% dos estados não haviam ratificado. mas para o modelo em que o tempo ea covariável (ex. Se uma variável categórica tem dois valores (por exemplo. Parcelas cumulativas de perigo. As curvas representam um indivíduo hipotético (ou outra unidade de análise). 1 = tabagismo pesado). Neste lote. Parcelas cumulativas de sobrevivência. eo evento é a ratificação da Constituição (o "risco" do evento). de pessoas ou outras unidades de observação a média da covariável (s).    As taxas de sobrevivência. o eixo X ainda é tempo de sobrevida. A curva (s) mostram como diminui a sobrevida cumulativa ao longo do tempo para tais indivíduos hipotéticos. idade) são preditores.

Se uma variável categórica tem dois valores (por exemplo. O teste Peto-Prentice-Peto é apropriado quando as funções de risco são assumidos como nãoproporcional entre os grupos. com base em uma análise previamente calculado com o comando stcox. e mais . que também pode ter um "por" parâmetro. 0 = não-fumadores ou light. . log-logístico. Weibull. utilizando o comando teste sts. peso nas duas vezes anteriores falha mais fortemente. dando meios covariável (por exemplo. Gompertz. supondo que um comando stcox já executado.  SPSS / SPSS: Como discutido acima.5 anos. declive parcelas risco cumulativo até esquerda para a direita a partir da origem na esquerda. em perigo). (ex. de (droga) vai dar uma parcela de função para a droga e droga = 0 = 1 se droga tem dois valores). Estes são a exponencial. 1. este pode ser realizado com a lista sts comando. nd). uma para cada valor da variável. Se alguém quiser sobrevivência ou de perigo funções como uma tabela em vez de um gráfico.05. As tarifas são apresentadas de uma pessoa hipotética escores que. o teste Tarone-Ware da igualdade . em número de indivíduos no grupo de risco no momento da falha e é adequado quando o pesquisador acredita que as funções de risco não variar proporcionalmente entre os grupos. o teste de Cox da igualdade. As curvas representam um indivíduo hipotético (ou qualquer outra unidade de análise). Teste de igualdade das funções de sobrevivência. o teste Peto-Prentice-Peto de igualdade). gráfico de r. e também um teste de parâmetro de forma paramétrica assumiu a função de risco de base (isto é relatado como o valor de p "/ ln_p "seguindo as taxas de risco. log-normal. O padrão de teste de log-rank é apropriado quando a cada tempo de falha deve ser dado o mesmo peso. Linhas da tabela são os intervalos de tempo (ex. Ou seja. o Nelson-Aalen função de risco cumulativa (gráfico st. a função de risco estimada (gráfico r.5 anos. o gráfico irá exibir curvas duas ou mais funções. mas os padrões de censura são semelhantes entre os grupos. 0.  sobrevivência.0 anos. O teste de Wilcoxon pesos. permitindo a comparação. o comando sts género de ensaio. Stata. com valores médios na covariável (s) a qualquer momento como representado no eixo X. na média do covariável (s). obtém-se um valor de qui-quadrado eo significado para esse valor.) SPSS / SPSS gera uma média "de covariáveis tabela". Se o valor da significância (p) é = <0. a idade média em um estudo das mortes por doença. 1 = tabagismo pesado). o teste de FlemingHarrington generalizada da igualdade). Trata-se de parcelas com o tempo de análise sobre o eixo x ea estimativa de sobrevida (1-0) ou a estimativa do risco cumulativo (0-1) no eixo y. o comando gráfico sts gera gráficos das funções-Meier de sobrevida Kaplan (gráfico r). O eixo Y é risco cumulativo. por grupo. o comando StrEG suporta modelos de sobrevivência que não seja o modelo de risco proporcional de Cox. mas este teste não é afetado por semelhança ou dissemelhança de censura padrões em grupos. em seguida. o "Quadro de sobrevivência" na saída de SPSS SPSS / contém a linha de base e previu taxas de risco. Por exemplo.  Stata: No Stata. como quando o pesquisador acredita que as funções de risco são proporcionais entre os grupos. o "por" parâmetro permite a comparação de sobrevivência ou de funções entre os diferentes níveis de perigo de uma covariável discretos. então haverá uma parcela de risco cumulativo para cada valor. ou escore médio de produtividade em um estudo de promoções). Qualquer que seja o teste escolhido. Wilcoxon dá o teste de Wilcoxon para a igualdade das funções de sobrevivência por sexo. realiza um teste de log-rank (o padrão) ou testes alternativos (o de Wilcoxon (Breslow) teste de diferenças nas funções de sobrevivência. O número máximo de grupos é de 800. 1. etc.. Se o "por" parâmetro é adicionado. os grupos diferem significativamente pela função de sobrevivência. as taxas de risco para as co-variáveis. Os pesos Tarone-Ware teste pela raiz quadrada do número de indivíduos restantes no grupo de risco no momento da falha e é semelhante hipóteses para o teste de Wilcoxon. A produção destes modelos ainda contém um teste de verossimilhança do modelo como um todo. e os modelos da gama. mas Wilcoxon mais. paramétrica em modelos de sobrevivência Stata. A curva (s) mostrar como os aumentos de risco acumulado ao longo do tempo para tais indivíduos hipotéticos.

O botão Parcelas no diálogo SPSS SPSS / permite que o usuário especifique preditores categórica para criar gráficos padrão. o significado não tem o seu significado normal e relevância). um grande debate no Convenções Constitucionais causa de compromissos entre Estados grandes e pequenos. como ilustrado abaixo. onde os padrões são o perigo ou sobrevivência funções plotados separadamente para cada nível das variáveis categóricas. de modo que possam ser de interesse para comparar estados no que diz respeito à função de risco (onde o "perigo" é a ratificação do da Constituição. parcelas Padrão. média ou grande. vemos que as funções de risco previstos foram de fato diferente para pequenas. (Nota: O tamanho não foi um preditor significativo de duração uma vez que outras variáveis foram controladas. No exemplo acima. a previsão é categórico tamanho. . o tempo e é até dia ratificação). Na ilustração acima. médias e grandes estados. mas desde que os dados são uma enumeração de todos os 13 estados originais e não uma amostra aleatória. Com relação ao exemplo de ratificação da Constituição. referindo-se um estado é pequena.

quanto maior o dfBeta. a sobrevida cumulativa. Altos valores de bandeira pode DfBeta erros de codificação ou erros de amostragem. ilustrada acima permite o cálculo da estatística de DfBeta para cada caso. dos Direitos foi o único preditor significativo. menos dias de duração para ratificação. o que mais removendo caso do conjunto de dados irá alterar o coeficiente b para que covariável. Use of these plots is discussed above in the "Baseline hazard. DfBeta é uma medida de quanto um determinado processo irá afetar o coeficiente de regressão para uma dada covariável. Remover NC teria mais efeito em uma direção positiva.227. and cumulative hazard rates" section and below in the "Assumptions" section. que não é um outlier pelo critério DfBeta). Outlier análise com DfBeta. Além da produção de estatísticas. Pelo contrário. Quanto maior o DfBeta para um determinado caso. o botão de Lotes em regressão de Cox no SPSS / SPSS apoia risco cumulativo. log-log-minus. para removê-lo seria deixar um dataset com menos dias de duração em média. . DfBeta reflete efeitos sobre a duração do evento para uma variável particular depois de outras variáveis no modelo são controladas. tamanho (2).  Parcelas. . Influentes casos pode ser manchado. para cada variável. e Direitos. A direção positiva corresponde a aumento de risco (de ratificação. ou podem chamar a atenção para clusters de casos que exigem um modelo diferente. Ou seja. a maior DfBeta positivo não corresponde necessariamente a unidade com a maior pontuação de tempo (que seria RI. Nas variáveis "na equação" tabela acima . survival. The Plots button dialog for PASW/SPSS is shown below. visualmente. mais o caso é "influente" para que covariável. para uma dada covariável. A saída DfBeta salvo acima tem quatro DfBetas para representar os quatro termos do Modelo 2 do exemplo utilizado neste módulo. DFB4_1 estimativas da mudança esse coeficiente se que caso seja removido. A opção Salvar da caixa de diálogo de regressão de Cox no SPSS / SPSS. Size (1). caso o estado) e. a fim de que entraram no modelo: VotePct. e parcial lotes residuais. No Modelo 2. NC teve entre os maiores durações. pela plotagem DfBeta para uma variável contra a variável de ID de caso. dos Direitos tinha um parâmetro coeficiente de -4. portanto. Remover SC teria mais efeito em um sentido negativo. No entanto.

since the average value of residuals at an tiime should be zero if the effects of the covariate being plotted are proportional (see Box-Steffensmeier & Zorn. as when 10 years from now person B is in their 70's. Partial residual . coefficient estimates are deflated and biased toward zero). For instance. quoted in Box-Steffensmeier & Zorn. rejecting the existence of true covariate effects) when rates cross rather than are proportionate. This can be a false assumption. with one such plot per covariate. considering age as the covariate. For ratios that decrease over time. then for hazard ratios that increase over time for that covariate. coefficient estimates are inflated). standard errors are incorrect and significance tests are decreased in power (BoxSteffensmeier & Zorn. 2001: 972). If a covariate fails this assumption. It is common for a covariate to fail the assumption of proportional hazards. This is a critical assumption of Cox regression and must be checked for each covariate.Pressupostos o Assumption of proportional hazards . 2001: 978-981). relative risk is overestimated (that is. for diverging hazards. Graphical methods may be used to examine covariates. when mortality spikes. 2001: 974) has reported as much as a 90% reduction in the power of significance tests (power = chance of false negatives. relative risk is often underestimated (that is. Gray (1996. A lowess smoothing line summarizing the residuals should be close to the horizontal 0 reference line for the y axis. and the implication for estimation should be reported. In SPSS one may create a plot of scaled Schoenfeld residuals on the y axis against time on the x axis. in a timeinvariant Cox model the ratio of hazards for persons a and b should be the same this year as in the period 10 years from now. ["Converging" means that the hazard rates for two groups formed by a covariate factor are tending toward the same rate over time]. for converging hazards. There are alternative ways to check:  Partial residual plots (Schoenfeld residuals PH test) . Cox regression with time-invariant covariates assumes that the ratio of hazards for any two observations is the same across time periods. Correspondingly.

the stcoxkm command may be run after defining data with stset but before running stcox (stcoxkm runs Cox itself. stcoxkm. The Save option saves the linear predictor values under the default variable name of X'Beta where XBeta is linear combination of mean corrected covariates times regression coefficients from the final model. Survival probability plots . This tests if the proportional hazards . PASW/SPSS does not save martingale residuals directly but they may be computed as mresid = event-haz_1. If random. not in the Covariates box. the covariate violates the proportional hazards assumption.   Martingale residual plots . If the two lines are close together. There will be one curve for observed and one for predicted values. distribution of residuals over time is random. where event is the event variable and haz_1 is the variable saved under the Save option for the cumulative hazard function. the proportional hazards assumption is not violated. as in the figure below. In a well-fitting model.methods are the most common and preferred methods for testing for non-proportionality in Cox models. Inder the Plots button. In PASW/SPSS select "Partial residual plots" under the Plots button after first having saved partial residuals by checking "Partial residuals" in the "Save New Variables" dialog box under the Save button in the Cox regression dialog. by(gender) ) to get multiple pairs of predicted/observed curves. for comparision purposes). The X axis is survival time. accepts the null hypothesis and means the proportional hazards assumption is not violated.  Stata: In Stata. The Y axis is the partial residual for a given covariate. fit lines should not diverge much from the Y-axis 0 reference line. If Martingale residuals on Y are plotted against the linear predictor (the right-hand side of the model equation) on X. If the lines cross. This can be checked further in the Chart Editor by adding a loess smoothing line or linear regression line to show non-random trends. provided the prior stcox command requested Schoenfeld residuals with the schoenfeld() option as illustrated in the figure below. This is an indication that it is a time-dependent variable. The null hypothesis is that there is a 0 slope of the log hazard ratio regressed on time.  PASW/SPSS: The covariate in question is entered as a "Strata" variable. one pair for each value of a discrete covariate. A statistical version is available in Stata by issuing the "estat phtest" postestimation command. One can add a "by" parameter (ex.. select "Survival". there should be no pattern of correlation if the proportional hazards assumption is met. A finding of nonsignificance. In Stata. A plot of cumulative survival on the y axis and analysis time on the x axis may be generated for two or more groups of a covariate.

For a given categorical covariate. then the interaction term between that covariate and time (ex. The X axis is survival time. The sthplot command is a similar test. where what is adopted is an innovation or piece of legislation. The ideal model for survival analysis would be manufacturing of a motor or light bulb. one may compute the baseline hazard function for each category of that covariate. In medicine. one may include a time-covariate interaction term in the model. then the baseline survival functions are parallel and the researcher rejects the need to conduct stratified Cox regression. and should have a regression coefficient not significantly different from zero.  Piecewise regression method . proportional hazard functions are not enforced for each level of the categorical variable. Alternatively. True starting time . In PASW/SPSS.  Categorical covariates . (Except if there are no data on predictor variables for. As a third alternative. The shape of the baseline hazard functions should be similar if the assumption of proportional hazards is not violated. A significant rho means that covariate violates the proportional hazards assumption. this means that the data series will be different depending on starting point and hence the computed hazard rate coeffiicients will differ. thus supporting the proportional hazards assumption. say. perhaps markedly. If a covariate fails the test of proportional hazards. the lines for the "by" variable should be parallel and not cross. If the zero point is arbitrary or ambiguous. Intersecting survival. In this test. but then regression coefficients are not computed so this is only an option when the covariate is not of research interest. If the assumption of proportional hazards is not violated for a given numerical (continuous or categorical) covariate. 2001: 975-976).. use the log minus log test of proportionality . However. at a minimum the researcher should conduct a sensitivity analysis to see how coefficients may change . the hazard function lines or LML for each category should be parallel. age*time or more commonly. also supporting a "by" parameter: if the proportional hazards assumption is valid. then model each sample separately to see if the estimated hazard ratio for each covariate coefficient is the same. age*log(time)) can be added to the model as in regression. if there is no violation. If there is ambiguity about the true starting time. This is the case in most time-to-adoption studies. then the proportional hazards assumption is violated and the covariate should be modeled as time-dependent. the covariate may be entered as a Strata variable. The LML method is not recommended for multiple covariates or when a covariate is continuous (see BoxSteffensmeier & Zorn. hazard function. the coefficients will be the same as for a study of 1981-2000).  Time interaction test . requested under the Plots button in PASW/SPSS.  Harrell's rho . If the time interaction effect is significant for a covariate. That is.  Log minus log plots (log-log plots or LML plots).o assumption is valid for all groups. or LML lines indicate clear violation of the assumption of proportional hazards. the true zero time in other analyses may be less clear. years 1900-1980 in a study of 1900-2000. one may divide the sample into observations above and below the median survival times. When entered as a Strata variable rather than as a covariate.  Relation to Cox regression with time-dependent covariates . have specified the categorical covariate as the Strata variable. the true zero point is often birth. Though considered an imprecise "rule of thumb" method. then the covariate in question is not time-dependent and would not violate the proportional hazards assumption in Cox regression. A rho coefficient may be computed for each covariate. The Y axis is log minus log. before which failure is logically impossible). click Plots. The cumulative survival estimate after the ln(-ln) transformation is applied to the estimates. Alternatively. this is evidence that it is time-dependent and one needs to abandon ordinary Cox regression in favor of Cox regression with time-dependent covariates. where there is a true zero time (the time of manufacture. If the survival plots for the groups of a single categorical covariate are oughly parallel (and certainly should not cross). In the PASW/SPSS option for "Cox Regression with a Time-Dependent Covariate" one may add time-covariate interactions to the model and if the interaction is not significant. check the "Hazard" checkbox. before which death from a disease is impossible. and enter the categorical covariate in the "Separate lines for" textbox.

When data independence is an issue.. or if irrelevant but correlated variables are removed from the model. the researcher should drop the most non-significant covariate from the model. and proceed stepwise until there are no more non-significant covariates in the final model. 1986: 14)." Proper model specification . Because Cox methods rely on order of events. Lack of independence leads to error terms being correlated.o o o o o o according to different starting points for data on the predictor variables. Unobserved heterogeneity (the effects of variance in important but unobserved variables) is associated with downward bias in duration dependence (Vermunt and Moors. so as to avoid the bias that arises when large numbers of cases are not "truly" at risk). It is possible that substantive interpretation of the final covariates may differ from inferences that might have been made for the model including non-significant covariates. Unobserved heterogeneity may be addressed by including random effects in the EHA model. EHA models assume the observation's event status at one point in time does not predict the observation's event status at a subsequent point in time. the Cox (and parametric EHA models) regression coefficients may change substantially and even reverse direction if previously omitted relevant variables are added to the model. the researcher should use more complex multiple event models for such data. This is the problem of autocorrelation in time series analysis. See above for a discussion of statistical output used in analysis of possible outliers. multiple states should be modeled explicitly. according to Box-Steffensmeier & Jones (1997: 1434). Independent observations . which in turn leads to biased estimates of standard error and significance. not a series of different types of events. In an event history analysis (EHA) context. No small samples . as a rule of thumb. Precision of parameter estimates using the partial likelihood methods employed in Cox models can be much less than for maximum likelihood methods employed in parametric event history models. so that any subject for any time period. As in other forms of regression. "Ordinary" Cox modeling deals with situations where the unit of analysis has a risk of a particular event. Clearly defined events . when the hazard ratio for some covariates is found to be non-significant. the model for "diplomatic resolution" may be very different from the model for "military resolution. Since in diffusion studies and many other social science areas independence is not a sound assumption to make. See Heckman and Singer (1982) on random effects procedures. meaning bias introduced by omitting important explanatory variables. this is discussed as the problem of unobserved heterogeneity . As in nearly all forms of analysis. 2005: 10). If the actual data have events representing multiple states. re-run the analysis. and/or a surrogate variable added such as number of neighbors adopting the innovation in a diffusion study. that subject may be clearly assigned (usually to status=0 or status=1. Absence of outliers . "this [Cox] method should not be used with small samples. The status variable must be unambiguously defined. a time variable may be included as a covariate. including frailty models (including a random parameter in the hazard rate to represent unmeasured risk factors) and split-population models (dividing observations into a sample that will never experience the event and a sample at true risk of experiencing the event. depending on whether the event of interest had occurred). the problem can be mitigated by the use of robust variance estimation .  Robust estimators . For instance.  Unobserved heterogeneity also biases estimates of covariate effects. the Breslow method is most often used). Rather. Therefore. there should be 5% or fewer tied observations in the dataset to still assume insignificant bias (Prentice & Farewell. outlier cases can bias estimates. including inappropriate covariates. Few ties . handling ties poses a computational problem. See BoxSteffensmeier & Jones (2004: Chapter 9) for an extended discussion of unobserved heterogeneity and ways to deal with it. which relaxes assumptions about the distribution of error . For example. using a time-constant latent covariate. Since coefficient size is a function of other covariates in the model.  Model-trimming strategies apply to Cox and other EHA models. time dependence must be modeled. Sensitivity analysis may or may not lead the researcher to conclude that Cox modeling is inappropriate." and subsuming both under "conflict resolution" will yield estimates unsatisfactory for explaining either state when using usual single-event Cox models. Although there are methods for handling ties (ex.

Less commonly. one should assume that it is quite possible that data will be temporally dependent (the value at time t+1 is partly a function of its value at time t). It results in the same parameter estimates as standard variance (algorithms assuming independence) but higher standard errors. Cox regression does not assume any particular distribution shape for the duration times of events. the researcher should use more complex multiple event models for such data. As such Cox regression is more robust than parametric models if the other assumptions of Cox regression are met. and after the event occurs the unit drops out of the risk pool. but rather the hazard rate. casualties is an endogenous covariate and Interpretation of hazard ratios will be biased for that covariate. the researcher need not de-trend the data but only use "robust variance estimation". clustered standard errors may be computed. Clustering accounts for serial time or spatial dependence by dividing the data into groups defined by a grouping variable. but if war duration also causes casualties (as it would). à condição de co-variáveis no modelo. Baseline distribution of survival times . This is related to the autocorrelation problem in time series analysis . there is no accepted method of dealing with endogenous covariates. then computes standard error across clusters. Robust estimation is recommended for parameter estimation for time-dependent covariates unless the researcher can demonstrate lack of time dependency in the data (that is. which refers to algorithms by Lin & Wei (1989) and Huber (1967) to adjust standard errors for time dependency. with equally problematic implications. however. robust estimation should be used most of the time). meaning the unit is still at risk even after the event occurs the first time. Interpretation of hazard ratios in models with time-varying covariates assumes those covariates are exogenous (covariate values may affect duration to event.. use the square). o modelo de Cox assume que o risco aumenta linearmente com o tempo. This problem is not unique to Cox modeling. Factor invariance . This is tested by running the model without the given covariate. If log linearity is not present. which relaxes assumptions of independence even further. one may have to transform the covariate (ex. then use Transform. yet leaving out a causally important endogenous covariate may be a form of model misspecification. Log linearity . With time series data. the use of single-event models in serial fashion assumes that experiencing an event in the past has no influence on experiencing the event in the future.terms. Unfortunately. Put another way. "Ordinary" Cox modeling deals with situations where the unit of analysis has a risk of an event. robust estimation increases the possibility that parameters will be found to be non-significant. This is because the "dependent variable" in Cox regression is not the event or time to event. unlike parametric survival analysis models such as Weibull models. hazard ratios will be biased. Since this assumption may well not be met. Instead. If the loess smoothing line through the scatterplot is close to linear. o o o o o o Not applying single-event models to multiple event data . Covariates are assumed to be linearly related to the log of the hazard function. If the actual data are multiple event in nature. The researcher is forced to choose the path of lesser evil. It is assumed that the causal factor structure is the same at the end as at the beginning of the study period. In Cox and other EHA models. Hazard rate linearity . then computing martingale residuals and plotting them on the y axis against the omitted covariate on the x axis. there is log linearity for that covariate. Se o tempo é medido por uma variável de contador em unidades de tempo. but it does save values for the cumulative hazard. and other models as found in Stata's streg procedure (see above). exponential models. That is. Exogenous covariates . but duration does not cause the values of the covariate). Compute . PASW/SPSS does not save martingale residuals. Robust estimation is usually the default in Cox and EHA software. Box-Steffensmeier & Jones (2004: 112) give the example of casualties as a time-dependent covariate in a model of war duration: the Cox model assesses if casualties affect war duration. Cox regression does not assume any particular baseline distribution of survival times.

whereas OLS and logistic regression are partial information methods when censored data are present. Time varying independent variables can be handled in Cox regression but not in traditional regression. If there are multiple highly correlated covariates. subjects entering in different time cohorts should be similar on the average. but all cases are used when estimating the baseline hazard. event analysis frequently centers on the analysis of rare events which are not well distributed. one strategy is to include in the model only one variable from the set of intercorrelated variables. Censored data are the cases where the event never occurs (where the status variable remains equal to 0) for all time periods. Whereas the usual regression model uses ordinary least squares or maximum likelihood estimation of parameters. Any given dataset on. which do not assume uncensored data. death) occurred in the final time period. The "Correlation Matrix of Regression Coefficients" table in PASW/SPSS output checks this. Event distribution . In Cox regression. disease and death. Traditional regression methods would require either dropping censored cases. Censored observations occur in all time to event data unless the data are historical. When there is no patterning. which is why techniques such as Poisson regression are more appropriate. 1. No censoring patterns . With such data. say. Thus Cox regression uses all available information and is considered a full information method. Example of PASW/SPSS Cox Regression Output o Cox Regression output from PASW/SPSS 14 Perguntas mais freqüentes o Why can't we just use OLS or logistic regression to analyze time until event data? There are four main reasons: 0. For example. meaning that the data on how long they will live is not yet known).. the computation of the regression coefficients is based only on the uncensored cases. .Haz_1. 2. Traditional regression requires events be well distributed over time. thereby risking sample selection bias. where event is the event variable and Haz_1 is the saved cumulative hazard variable. This is discussed further in the FAQ section below . However.o o o Variable to compute martingale = event . thereby affecting their status on the status variable. with all data present for all observations. The large numbers of zeros may inflate correlations and parameter estimates in traditional regression. thereby also biasing computed coefficients. Censored data are not handled by traditional methods. most time periods will have a value of zero. will contain data on people who have the disease and died (the uncensored observations) and people who have the disease but who have not yet died (the censored observations. Cox regression uses partial likelihood methods. it could be all censored cases in a public policy study are cases which were ineligible for policy benefits. or treating censored cases the same as those for whom the event (ex. which instead should be missing at random. Not having high multicollinearity is an assumption of Cox regression. There should be no pattern to these cases. as in other forms of regression. No high multicollinearity . Censored cases must be independent of the survival distribution. Random sampling of data is assumed.

which is very rarely. Logistic regression using a binary (0. Also. Time series regression using count of cases experiencing the event in a given time period became a second popular approach. However. degree completion) may occur. traditional regression on cross-sectional data lacks the ability to establish causal direction of the net effects. a 0-1 code for whether the risk event (the "censoring variable") ever occurred for that unit. Of course. "there are few instances we can think of where one would naturally prefer a parametric duration model over a Cox-type event history model for most kinds of social science applications. even the net effects found in cross-sectional regression will be misleading (if. states). education in the short term decreases the likelihood of being employed but in the long term increases the likelihood of being employed. If there is a time-varying covariate. Cross-sectional OLS using duration times as the dependent variable was the original approach. as noted by Buckley & Westerland (2004). If there are no time-varying covariates. for instance.. . there must also be a duration (time periods to event) variable and each unit of analysis must have a separate row for each time the covariate changes in value. Even when there is not complete self-canceling. in the past there has been over-reliance on parametric EHA models such as logit and probit which. click here . and one or more columns for the time-fixed covariate(s). When the variable in question "cuts both ways. require the researcher to specify duration dependence (the shape of the hazard rate over time). To study such processes. misspecification of which can lead to computed standard errors which are too large or too small. Poisson regression was often used in place of OLS regression. employment) over a long period of time during which various relevant events (ex. yielding an effect size of zero and the erroneous conclusion that the variable did not matter (ex. the proportion of unemployed to employed varies greatly over time in a study of the effects of eduction on employment). OLS and logistic regression on cross-sectional data yields effect sizes which show net effect. Moreover. Full effect vs." Also. o Describe data setup for Cox regression  Event history data setup .o o 3. More often. the counting process data setup is used for time dependent data. one needs a time series method which traces the individual through various states (ex. When would one use a parametric event history analysis model rather than a Cox model? Only when one has strong theoretical reasons for positing a particular distribution (shape) for the baseline hazard function. OLS models of duration times can even generate impossible negative durations. 1) event variable as the dependent became another popular approach. 12 for 12 time units since onset of risk). it does not support individual-level (id-level) effects. OLS does not allow assessment of time-varying predictors unless such variables are aggregated. but this did not support time-varying predictors either. 3. if the process being studied is not stable over time. however. 2. leading to errors of inference. but aggregation intoduces bias of its own. unlike Cox models.. Couldn't I use Poisson or logistic regression instead of event history models when analyzing time to event? 1.. unemployment. Data setup in Stata is discussed below . for a population ages 18-22.. While this approach supports time-varying predictors. data setup must be compatible with the software used. Box-Steffensmeier & Jones (2004: 66) write. event history data setup has a code for the unit of analysis (ex. net effect . Because counts were the dependent. For further discussion of why event history methods like Cox regression or survival analysis are preferred to using logit or probit regression in diffusion studies." effects could even cancel out. a duration (time elapsed) count variable (ex. it is possible that these cross-cutting effects would cancel out).. Cox models can generate the same information as EHA parametric models without having to make as strong data assumptions.

code =  . a t0 variable. at the point of observation and no failure occurred (ex.4 would be the start of the 4th year of risk and the stop would be the end of the 4th year). the t0 variable might be labeled "Begin" and the t variable labeled "End. At a bare minimum. The stset command declares the researcher's data format. d. with the start representing the start of risk and coded 0 (thus start/stop 3. For dataset with patid = patient id. Multiple-record data with multiple events . There are also columns for the start or stop interval number." If there is no event variable. years). id(patid) failure(died). Survival Analysis. it is assumed that all observations fail (the event occurs) at time t. t). for each observation. in a study of peace=0. Command: stset day. t0 is assumed to equal 0. it is assumed all observations pertain to a single subject ("single-record st data"). some units of analysis might not have rows for some time periods (ex. If the event variable is zero (failed = 0) for an observation. where the span is (t0. t is the analysis time at the point of measurement. so that country would have a row for the year war started but would have no further rows until it was again at risk of another war (that is. And there would be additional columns for the timevarying and time-fixed covariates. day = the time variable (t). Setup & Utilities. Cox data setup in Stata:  Survival time data (st data) is a data format in which each observation is a time span for a given observation (subject). For instance. Time dependent data and multiple event data (where the risk event may occur more than once for the same unit of analysis) are usually entered in "counting process" format.o Counting process data setup . Command: stset failure. Income). 2. Single-record data with censoring . The t0 variable is assumed to be 0. id(patid) fail(code==402). and bearings. For instance. etc. load. the time variable must be declared. Declare data to be survival-time data." There may also be an event (aka status or failure) variable. some years) if risk did not exist for those periods. There are various variants depending on whether the st data also have an id variable.  Declaring st data in Stata is the first step in Cox regression in Stata (unless you have ct data. 3. For a similar dataset but with an event variable called 'failed' as well as failtime. Enter the time variable and the failure variable. with 1 being the occurrence of the event.  Discontinuous risk intervals . There is also a column for the time periods (ex. Under unusual circumstances. select Statistics. Age. t. 1. accomplished with the stset command. If the id variable is omitted. a country already at war would not be at risk of war. Single record data . states) has an id code and is represented by as many rows of data as there are time periods (ex. Failure is assumed to occur at time = failtime. or an event variable.. The start of "0" would not necessarily be the same actual year for every unit if for some reason the start of risk varied by unit. measurement was stopped at time t and the case is censored. years from 1980. and bearings (another covariate).. the event variable d might be labeled "Died" or "Adopted. Command: stset t. Each unit of analysis (ex. failure(failed). with three variables: failtime (the t or analysis time variable). Multiple-record data . where d=1 if the observation failed (the event occurred) during that particular span but if not. Command: stset failtime. died is the event variable (0 or 1. In Stata. war=1. with 1 = died).. There would also be a column for the risk event (the "censoring indicator"). For a dataset on electric generator lifetimes. There are variables t and t0. Cox regression and related survival analysis is performed on st data... failtime is the time. discussed below). coded 0 or 1. There may also be covariate variables (ex. If there is no t0 variable. For example. meaning we know the generator will fail at some point after t but we do not know when).). and there are covariates also. meaning the period from just after analysis time t0 up to and including time t. 1981. In the menu system. Covariates will be utilized if in the dataset and do not have to be declared. load (a covariate).. For a dataset on patients where patid is the patient id. Examples are from the Stata manual: 0. the first year of peace). is 0. There is an id variable which indicates the subject associated with the given observation.

. 10. Scaling time data . 8. the original time variable may be in days. but with different options (ex. Analysis is done on curday adjusted for adday. having an operation is considered the onset of risk in this command syntax." "multiple records at the same instant.25 days in a year. In the one above." "entry time missing. Let hospital code 286 mean "patient undergoes operation. Multiple record dataset with delayed entry of observations . Multiple record data recording time rather than t (analysis time) . Since there are 365. create the variable evervoted if for any time period the variable voted=1).. ever(). Not discussed here. dates may be displayed in date format but are. the origin() function converts the time variable into an analysis time variable. Other data setup commands . patid is the id variable. . Sometimes the original time variable must be adjusted not only for a different origin (ex. So this command is saying day is the time variable. but also there is a need to convert time units using the scale() function. in fact. as to add a time-varying covariate which will be the same for existing variables but have different values of the covariate for each of the new records. the number of right-censored cases (see below). ct data is first converted to st data using the ctset (declare data to be count-time data) and cttost (convert ct data to st data) commands. integers. 5. Command: stset curday. but the researcher wants years. curday could be a date variable without any change to the command syntax. adding the function scale(365. and if(). For a similar dataset. 6. Temporary re-declaration of st data . The origin for a given patient is (curday . Multiple record data with time from event . For instance. 9. hospital patient status codes. id(patid) fail(code==402) origin(time adday)." Then for the same dataset as above. The command stgen will create new covariates as functions of time variables and covariates (ex. In Stata. Stata supports the streset command to temporarily re-declare a previously declared st dataset. there are variables for the number known to fail during that time. For each time." among others. as by carrying forward covariate values from the first observation. id(patid) fail(code==402) origin(code==286). Command: stset curday. id(patid) fail(code--402) origina(time adday) enter(code=152). That is. The default is scale(1). and there are covariates. so in this example. Stata also provides a number of additional functions such as enter() and exit() for specifying when an observation is in the sample. That is. observations for this patient after the one with code=152 will be in the sample. (Note the actual command must have two equal signs). but with adday containing the day of admission (entered in time units) and curday containing the time variable (number of days since the ward opened in this case). Stata does a certain amount of data format error-checking. The Stata command stfill is used to fill in missing values. which accepts the time units as originally entered. The stbase command resets all variables in a multiple-record dataset to the base values in the earliest record for the subject. where 402 = death. and the number of new cases added during the given time.25) to the stset command line will rescale the timevar variable as desired." and "overlapping records. The command stsplit will create multiple records out of one record. 11. 7. the original time variable has 0 as the start of measurement. never(). not the onset of risk) using the origin() function. Error messages . Command: stset curday. this command analyzes time from operation until death (code==402). Not discussed here. with error messages for "event time missing. admission to hospital was considered onset of risk. The enter() function adds a patient to the analysis only once a record indicates the patient has had the test (code==152).adday). and code=402 is equivalent to the event variable = 1. 4. Count time data (ct data) is an alternative data format in which each observation is a time. a different definition of time origin). and after() for conditional inclusion. Let hospital code 152 indicate a patient is given a test. Other functions .. Note: in Stata. That is.

Golsch. 205). 1973. Mahwah. Blossfeld. See the summary by Box-Steffensmeier & Jones. Any variables not in varlist will have the values carried forward from the t0 record/observation. The authors further found that nonrandom selection of samples could lead to "inaccurate predicted hazard and survival functions" and "erroneous conclusions about what factors influence (or do not influence) the duration process of interest" (p. Selection bias and continuoustime duration models: Consequences and a proposed solution.. Daniel S. Stata will take the earliest timevar and make that t0 and use time units since t0 to create the analysis time. although the strata option does generate different baseline hazard functions for subgroups of a categorical variable. Bibliografia o o Boehmke. Frederick J.192). & Shannon (2006) conducted Monte Carlo simulations on this question. Snapshot data is a common real-world data format that must be converted to st data format. American Journal of Political Science 50(1): 192–207. Stata software does support multilevel Cox regression. From the survival function. and the assumption of a constant hazard rate between failure times. o Why is no intercept coefficient reported for Cox models? In Cox models. the hazard function can be derived. The varlist variables in the converted st dataset will have the values from the corresponding observations of the snapshot dataset. Megan (2006). o Does SPSS support multilevel Cox regression? No. there is just a time-of-observation variable. each positing a shape of the baseline hazard function. Event history analysis with Stata . & Shannon. coming to the conclusion that "sample selection issues can lead to biased parameter estimates. or the original articles by Kalbfleisch & Prentice. Morey. In Stata one converts snapshot data to st data using the snapspan command (syntax: snapspan idvar timevar varlist). the baseline hazard function is selected based on theory. o Since the Cox model does not posit any particular baseline hazard ratio. or possibly based on comparisons of model fit among several alternative parametric models. variable entries. 2004: 64-65. . Katrin. NJ: Lawrence Erlbaum Associates. the risk at any given failure time. 1980. Morey. o Can I use Cox regression with non-random samples? Boehmke. how can the baseline hazard function be retrieved? The survivor function can be estimated from the order of failure times. Note that the estimate of the baseline hazard function in Cox models is data-driven. Rather than have separate t0 (begin) and t (end) variables. Götz (2007). the intercept is incorporated in the baseline hazard function. & Rohwer. including the appearance of (nonexistent) duration dependence" (p.. t. Hans-Peter. whereas in parametric event history analysis models.

JP & Moeschberger. & Samore. Lists all Stata commands and options pertaining to Cox regression and survival analysis. Gray.sagepub. (2006). SI. College Station. (2004). & Marchenko. & Branton.. Hazard ratio in clinical trials. Duration dependence. Prentice. Box-Steffensmeier. 267-278. Huber. and competing events for state policy adoption. Hans-Peter. and this is perhaps the mostrecommended Stata text for it. Janet M. Box-Steffensmeier. Second ed. Techniques of event history modeling . (2005). (2004). (1978). Suzanna.. Janet M.Mario Alberto. Event history modeling: A guide for social scientists . & Jones. Janet M. Time is of the essence: Event history models in political science. American Politics Research XX(X): 1-37. Jones. Bradford S. NY: Cambridge University Press. Ragusa. RL (1980). Gould. Unrau. DeBoef. DW & Lemeshow. and downloaded from apr. Reid. Regina P. Kalbfleisch. Rohwer. (2004). Bradford S. Janet M. . Yulia (2008). PJ (1967) The behavior of maximum likelihood estimates under non-standard conditions. Mills. . YA & Coleman. Christopher JW (2001). with examples. Box-Steffensmeier. Jordan Michael (2010). 41(4): 1414-1461. Berkeley: University of California Press. Stata is a preferred software package for Cox regression and survival analysis. Econometrica 46: 1251-1271. Emory University. Antimicrobial Agents and Chemotherapy 48(8). American Journal of Political Science 45(4): 972-988. Jerry A. H. M. Published online in July. Unpublished MPH Thesis.com. and correct standard errors: Improving EHA models of state policy diffusion. State Politics and Policy Quarterly 5(4): 420-443. ML (1997). JD & Prentice. Klein. London: Sage. Götz (1995). Introducing survival and event history analysis . Mahwah. The lifecycle of public policy: An event history analysis of repeals to landmark legislaive enactments. Melinda (2010). functional form. Specification tests in econometrics. Biometrika 60. Buckley. American Journal of Political Science . Relative risk and odds ratio regression. Administration in Social Work 30(1): 45-65. State Politics and Policy Quarterly 4( 1): 94–113. BT (1986). Spruance. Repeated events survival models: The conditional frailty model. Event dependence and heterogeneity in duration models: The conditional frailty model. (2007). Bradford S. Political Analysis 15(3): 237-256.o o o o o o o o o o o o o o o o o o o o o o o Blossfeld. (1997). Grace. Box-Steffensmeier. Survival analysis: Techniques for censored and truncated data . Kyle A. Annual Review of Public Health 7: 335-338. Statistics in Medecine 25: 3518-3533. Todd Edward (1996). Lin. Cleves. & DeBoef. NJ: Lawrence Erlbaum. College Station. 2010. Suzanna (2006). Department of Biostatistics. Janet M. The impact of deviations from the proportional hazards assumption on power in the analysis of survival data. Stata survival analysis and epidemiological tables reference manual release 9 . & Joyce. Gutierrez. M. NY: John Wiley & Sons. S.. Beyond logit and probit: Cox duration models of single. TX: Stata Press. William. Box-Steffensmeier. Hosmer. DY & LJ Wei (1989). RL & Farewell. Evaluating program outcomes as event histories. 2787-2792. Kalbfleisch. & Zorn. repeating. Journal of the American Statistical Association 84: 1074-1078. The statistical analysis of failure rate data . (1999). Provides R examples. TX: StataCorp LP. Provides an example of using event history analysis using Stata. RL (1973). JD & Prentice. NY: Springer. Applied survival analysis . Hausman. An introduction to survival analysis using Stata. & Chad Westerland. Duration models and proportional hazards in political science. Jack. Roberto. NY: John Wiley. Rollins School of Public Health. In Proceedings of the Fifth Berkely Symposium on Mathematical Statistics and Probability . & Jones. The robust inference for the Cox proportional hazards model. 1951-2006. JE. Marginal likelihoods based on X\Cox's regression and life model. StataCorp (2005).

Tais eventos são referidos genericamente como falhas que o evento pode. em um estudo demográfico. Poortema. As principais áreas de aplicação. 2008. Deixar ser a variável aleatória não negativo que representa o tempo de falha de um indivíduo arbitrário. 2010 G. Iremos introduzir a função de sobrevivência ea função de risco que caracterizam a distribuição de também. Estatística Médica e Epidemiologia (153133) Análise de Sobrevivência (semana 02) Hazard / taxas de insucesso. David Garson last updated 9/7/2010. Supomos que a distribuição de probabilidade de é descrito por uma função de densidade . no entanto.@c 2006. 2009. por exemplo. são estudos médicos sobre doenças crônicas e ensaios de vida industrial. Nós supomos que as observações estão disponíveis no tempo de falha independente indivíduos. ser o desempenho de uma determinada tarefa em uma experiência de aprendizagem em psicologia ou mudança de residência. 24-10-2006 ÍNDICE 1 2 3 4 5 6 7 Função de sobrevivência e função de risco Distribuições de taxa de falha Kaplan Meier Os modelos de regressão modelo de riscos proporcionais Modelagem e ensaios no modelo de riscos proporcionais Atribuição Seção 1: Função de sobrevivência e função de risco Esta parte do curso de Medicina de Estatística e Epidemiologia negócios com a modelagem e análise de dados que tem como principal ponto final do tempo até que um evento ocorre. de regressão de Cox K. A função de sobrevivência é definida por (1) .

Isso é conhecido como a propriedade sem memória da distribuição exponencial. Para a distribuição Weibull obtemos (9) (10) Uma verificação empírica para a distribuição Weibull é fornecido por uma parcela da estimativa de contra . A função de risco especifica a taxa instantânea de falha em sobrevivência em condicional ao tempo e é definida pelo limite de da seguinte proporção: (2) Tomado esse limite obtemos (3) . Esta função risco é monótona decrescente para É monótona crescente para e reduz a uma constante. mas também porque a função de sobrevivência é determinado pela função de risco: (4) (Nota: ) Seção 2: Distribuição de taxa de falha Nesta seção. (Nota para cada número no caso de uma função de densidade). A trama deve dar cerca de uma linha reta. Uma importante generalização da distribuição exponencial permite uma dependência de potências da função risco no tempo. Essa parcela deverá aproximar de uma reta passando pela origem como se pode concluir a partir de (7). Daí e siga com bastante facilidade. O parâmetro de uma distribuição exponencial é obtida para tendo a função de ser um perigo constante: (Com . se . A distribuição de é especificado como também pela função de sobrevivência . Assim. Onde é a distribuição cumulativa de . para a distribuição exponencial da taxa de falha instantânea é independente da de modo que a chance condicional de falha não depende de quanto tempo o indivíduo foi a julgamento. Note que a derivada da função de sobrevivência é igual a . . apresentamos uma série de modelos de distribuição de . Uma verificação empírica da distribuição exponencial para um conjunto de dados de sobrevivência é fornecido por traçar o log da estimativa da função de sobrevivência versus . A distribuição dos é especificado por sua função de risco.e é igual a . Desde a função de distribuição cumulativa especifica a distribuição de . Isso produz os dois parâmetros da distribuição Weibull com função de risco (8) .

onde é a conhecida gama de funções muito bem: ( ). A distribuição gama pode ser considerada como uma outra generalização da distribuição exponencial. 1+ 5+ 6 6 9+ 10 10 10 + 12 12 12 12 13 + 15 + 16 + 20 + 24 24 + 27 + 32 34 + 36 + 36 + 44 + . Além disso. vamos supor que o processo de censura é independente do processo que pretende estudar. isso significa que a falha exata tempos de um certo número de indivíduos não são conhecidos. Estudamos a sobrevivência de 49 pacientes com câncer colorretal Dukes'C. Seção 3: Estimador de Kaplan Meier A análise de sobrevivência está preocupado em estudar o tempo entre a entrada de um estudo e um evento posterior. consideramos apenas a censura à direita. Existem várias razões para censurar. Originalmente. Para a densidade (11) se reduz a densidade da distribuição exponencial. são perdidos de seguimento. Neste texto. Control ( Tratamento ( ) 3+ 6 6 6 6 8 8 12 12 12 + 15 + 16 + 18 + 18 + 20 22 + 24 28 + 28 + 28 + 30 30 + 33 + 42 ácido linoléico. Para estes uma falha desconhecida vezes só se sabe que o tempo de falha superior a um valor conhecido. para citar alguns: Alguns pacientes podem ter deixado o estudo inicial. bem como a mortalidade. a nota . chamado censurar o tempo. a análise estava preocupado com o tempo até à morte. o que significa que algumas vezes o fracasso não são conhecidas. Os tempos de sobrevivência (meses) de dois grupos de tratamento são os seguintes. descrito por expectativa e uma variância . Se tem uma distribuição lognormal. a distribuição de uma falha ou tempo de sobrevivência é a inclinação. os acidentes fatais no trânsito (concorrente de risco) Estudo termina quando um tempo fixo é atingido (direito de censura do tipo I) Estudo ens quando um número fixo de ocorrer uma falha (direito de censura do tipo II) Nestes exemplos. daí o nome. Uma característica comum de dados de sobrevivência é censura.Em geral. Exemplos: a emigração. a sua função densidade é . então isso significa que tem uma distribuição normal. mas a análise de sobrevivência é aplicável a muitas áreas. há direito a censura. Skew distribuições podem ser modelados por meio de uma distribuição lognormal ou uma distribuição gama tão bem.

Cada fator no estimador de Kaplan Meier representa uma menos uma taxa de risco calculado. Secção 4: Os modelos de regressão Na seção 2 distribuições de sobrevivência foram introduzidas diversas para a modelagem da experiência de sobrevivência de uma população homogênea. pouco antes do tempo vivo (O dia k ordenou o tempo de sobrevivência) e denota o número de pessoas que morreram na hora . Nós assumimos que os tempos de sobrevivência (pacientes) já estão ordenados de tal forma que . este é o número . Para o grupo de tratamento que deve estimar a função de sobrevivência . Para um dado valor encontrar o maior valor de tal forma que . de um grupo homogêneo de pacientes são representados por . A estimativa da Fórmula (13) é o produto de fatores . A primeira entrada (3 +) do grupo controle significa que o paciente deixou o estudo. também chamado de estimador produto limite. parcela seguinte é um gráfico da estimativa da função de sobrevivência do grupo de tratamento. Para a estimativa do usamos o estimador de Kaplan Meier. Suponha que os tempos de sobrevivência. obtemos (14) para (15) para (16) para (17) para para A estimativa Kaplan Meier é apenas um passo função. torna-se interessante considerar generalizações destes modelos a ter em conta as informações de variáveis explicativas. Para o grupo de tratamento com esses tempos são 6. Vamos determinar as estimativas para o grupo de tratamento. Para observações censuradas 1 + 5 + e esses fatores é igual a 1. Assim. . Normalmente. Recebemos para . A probabilidade é então estimado pela (13) onde é o número de indivíduos. função esta etapa somente as mudanças no tempo de sobrevida com um resultado positivo . depois de meses de sobrevida 3. incluindo observações censuradas. Após a recepção do estimador de Kaplan Meier. 10. 24 e 32. o tempo de sobrevivência correspondente é conhecido por ser superior a 3 meses. Assim. 3 (meses) é o tempo de censura do paciente. Então. no entanto. algumas vezes chamado o número de risco. A parcela correspondente do grupo de controle é a seguinte. Tempo de sobrevivência considerarmos o número de pessoas ainda vivas. existem variáveis explicativas sobre a qual pode depender tempo de falha. a probabilidade de sobreviver condional é estimado de forma direta pela . 12.12 + Aqui + significa censura.

Para a distribuição Weibull análogo de (21) é: . O principal problema tratado nesta seção é a de modelagem a relação entre o tempo de falha e as variáveis explicativas. a função de sobrevivência de uma distribuição exponencial com parâmetro . Em modelos de regressão é uma prática comum que a variável dependente depende das variáveis explicativas apenas por uma função linear . Conseqüências da (21) são: Por tempo de falha log que quase se um modelo de regressão tradicional. Portanto. Vamos explicar o que a hipótese (21) sobre a função de risco significa que se nós estudamos o tempo de falha log . Na análise de sobrevivência tempo de falha acelerado modelos são obtidos através de modelagem do tempo de falha log em vez do tempo de falha em si. uma função de risco dada por (8). temos uma função de risco constante . Vamos usar o seguinte fato da teoria da probabilidade: se tem a distribuição exponencial com parâmetro então podemos escrever onde é uma variável aleatória com uma distribuição exponencial com parâmetro . em vez podemos dizer que tem a distribuição exponencial com parâmetro . permitindo que a taxa de falha a função de . A distribuição exponencial pode ser generalizado para obter um modelo de regressão. De (24) pode-se concluir que os efeitos das covariáveis (variáveis explicativas) atuam aditivamente na . Por esta razão. Note que o termo é o intercepto (constante) do modelo de regressão. este prazo pode ser estimado considerando que ambos os e não podem ser estimados. é natural de escolher a função de tal forma que é positiva. Para cada indivíduo temos valores de variáveis explicativas. de fato e são idênticos no que diz respeito à sua distribuição. muitas vezes leva . Observe que o explicativas podem incluir tanto variáveis quantitativas e variáveis qualitativas como grupo de tratamento. Observe que a função de sobrevivência é igual a . taxas de risco a ser positiva. Lembre começamos com (21): o ato multiplicatively covariáveis sobre a taxa de risco.Considere vezes falha de indivíduos. portanto. independentemente dos valores de . A perturbação não tem uma distribuição normal. A taxa de risco em um modelo de regressão é então modelado por . A) a nova taxa de risco (é considerado como sendo uma constante ( ) Algumas vezes a função da função linear . Vamos agora considerar a distribuição Weibull. como uma questão de fato. Para a distribuição exponencial. esta pode ser incorporada através do uso de variáveis indicadoras. Em um modelo de regressão para análise de sobrevivência pode-se tentar modelar a dependência dos motivos tomando a) perigo de nova taxa (a ser . a taxa de risco de base passa a ter . onde são parâmetros desconhecidos. que é igual a (7).

podemos afirmar o seguinte: se tem uma distribuição de Weibull com parâmetros e então podemos escrever onde tem a distribuição exponencial com parâmetro .. Secção 5: O modelo de riscos proporcionais Um modelo com uma taxa de risco especificados pelo (21) é chamado de modelo de riscos proporcionais. aplicação de "Cox de regressão para um tem que escolher em SPSS Análise primeiro. Equação (21) é parte integrante do modelo de regressão com uma distribuição exponencial para o tempo de falha. . Desde os efeitos das covariáveis são ditas multiplicatively agir sobre a taxa de risco. mas uma das características mais importantes do modelo de Cox é que nenhum modelo paramétrico é feita para a linha de função de risco-base . conforme o esperado. cuja distribuição é descrita por uma função de risco dada por onde é uma base-line função de risco indeterminado arbitrária que especifica uma distribuição contínua para uma taxa de falha. No caso da distribuição Weibull nosso modelo pode ser chamado de um modelo de riscos proporcionais também. censor e tratamento. Voltamos a estudar o tempo de falha log . o que equivale a expressão (9). Esta equação de regressão é uma generalização de (25). utilizou-se o número 0 para o controle eo número 1 para o grupo de tratamento. depois de Sobrevivência e. finalmente. A segunda coluna indica se os tempos de sobrevivência são censurados ( ) Ou não . Seção 6: Modelagem e ensaios no modelo de riscos proporcionais SPSS (como outros programas) fornece estimativas e erros-padrão. Mais uma vez os efeitos das covariáveis ato aditiva no tempo de falha de log. nós mostramos que a função de sobrevivência equals (9). por exemplo para os parâmetros no modelo de riscos proporcionais de Cox. assim que esta coluna contém apenas os números 0 e 1 também. De (26) e pode-se obter: com . Para produzir a saída relevante tem que escolher o tempo de sobrevivência. Para testar a teoria demonstrando que aplicar o modelo de riscos proporcionais aos dados da seção 3. a função de sobrevivência da distribuição de Weibull: . Portanto. O modelo de risco proporcional mais famoso é o modelo de riscos proporcionais de Cox. esta coluna contém apenas os números 0 e 1. No SPSS temos que preencher os dados da matriz da seguinte maneira. censor de status (define evento único valor 1) e tratamento como covariável. Casos especiais são (Distribuição exponencial) e (Distribuição de Weibull). Usando a teoria da probabilidade. Use 'método ainda: digite'. Para provar isso. Cox de regressão. Nós demos as colunas (variáveis) nomes: sobrevivência. A terceira coluna indica a que cada grupo pertence o tempo de sobrevida. No modelo de riscos proporcionais de Cox falha independente vezes são estudados. Uma coluna contém os tempos de sobrevivência 49.

Nenhuma estimativa para o é dado. Isso pode ser feito através da introdução de variáveis de indicadores. Usando SPSS uma parte da produção é a seguinte: B SE 0.557 Exp (B) 0. Diferenças de ano para ano pode ser modelada através da atribuição de efeitos para os níveis (resultados) do Nascimento covariável. Os dados estão contidos pelo breastfeeding. não temos de rejeitar a hipótese nula. vemos e .sav arquivo do sistema SPSS. 0. Fazendo isso.Temos agora deve investigar se os grupos diferem muito em relação ao tempo de sobrevida. Isso torna um teste equivalente. Daí o resultado de é . Inspeção do conjunto de dados revela que o resultado do Nascimento covariável intervalos de 78 (representando 1978) para 86.430 Wald 0. rejeitamos se ou . chamamos esse conjunto de dados os dados de amamentação. Esta estatística Wald tem distribuição qui-quadrado com um grau de liberdade sob a hipótese nula: nível de significância de 5% significa que a hipótese nula é rejeitada se a estatística de Wald . Para os dados da seção 3. Nós aplicamos um modelo de riscos proporcionais com motivos (variável covariável) tratamento. preto. Equivalentemente. Há que ter como estatística de teste com sendo a estimativa da e sendo o erro padrão correspondente. assumimos que a função de risco para um indivíduo é dada por com o sendo os valores do tratamento variável. A hipótese nula é rejeitada se ou . A amamentação dados aos dados relativos aos 925 primeiros filhos nascidos cujas mães escolheram para o aleitamento materno. ou se existe realmente um efeito do tratamento. se . As seguintes variáveis são registradas: Duração Censura corrida Pobreza Fumar Álcool Idade Nascimento Escola Pré-natal duração do aleitamento materno (semanas) 1 para amamentar concluída.345 df 1 Sig. De saída. O nascimento covariável é mais uma variável categórica. testamos a hipótese nula contra a hipótese alternativa . outros) mãe em situação de pobreza ( sim. Para investigar se há realmente uma diferença entre os dois grupos. Em vez de SPSS apresenta uma Wald Estatística é igual a . Talvez a duração do aleitamento materno é diferente para os bebês de diferentes anos de nascimento. não) a mãe fumou no nascimento da criança ( sim. nenhum efeito do tratamento pode ser provada (a nível de significância de 5%). não) Para uma primeira preparação para a atribuição estudamos como a duração depende do Nascimento covariável. Para a atribuição desta parte do curso de Medicina de Estatística e Epidemiologia um conjunto de dados tem de ser estudada.777 tratamento Como o fator de podem ser absorvidos pela função de risco de base . Tendo em nível de significância de 5%. após três meses rd ( sim. A distribuição da estatística de teste é aproximada pela distribuição normal padrão sob a hipótese nula. não) uso de álcool mãe ao nascimento do filho ( sim. não) idade da mãe ao nascimento do filho ano de nascimento da criança anos de escolaridade (nível superior) O pré-natal. 0 para censurados (ainda amamentando) raça da mãe ( branco. Para este tipo de covariável não é útil para assumir uma taxa de risco de forma (31) com o sendo agora os valores do Nascimento covariável. No caso dos dados de aleitamento materno nos introduzir variáveis indicadoras para o nascimento covariável definidos como segue: . .

089 0.529 2.. Em vez de o último valor o primeiro valor pode ser escolhido como valor de referência (categoria ) em SPSS. o nosso modelo.489 0. pode ser diferente para os conjuntos de dados diferentes.421 Wald 18.419 0.514 0. nascimento (2). se o resultado de nascimento é de 79 e em outros lugares. Assim.018 0. se o resultado de nascimento é de 85 e em outros lugares. Concluímos que a distribuição (de) Duração depende do Nascimento covariável.388 0. Vamos testar a hipótese nula contra a hipótese alternativa ..722 -0. . B nascimento nascimento (1) nascimento (2) nascimento (3) nascimento (4) nascimento (5) nascimento (6) nascimento (7) nascimento (8) -0. Em vez disso.411 3.421 0. Os graus de liberdade depende do número de variáveis indicadoras.486 0. 0.340 Exp (B) 0.800 2. Usando SPSS o seguinte resultado é obtido.669 Na primeira coluna da tabela de parâmetros são indicados.901 5.406 2.112 0. ao nascer (8). Testando a hipótese nula contra a hipótese alternativa para cada indicador variável nenhuma hipótese nula deve ser rejeitada ao nível de significância de 5%.495 0. Em nossos testes problema que temos de rejeitar se Wald (Chi quadrado com df . Contudo.666 -0. Usando essas variáveis o indicador de taxa de risco e. O nível de significância de 5%). portanto.853 2. Nós não damos uma fórmula explícita para a estatística Wald com (aqui) de 8 graus de liberdade.411 estamos aqui rejeitar a hipótese nula. ..433 0. excepto um (verifique isso).707 -0. SPSS apresenta (o resultado) uma estatística de teste Wald sob a hipótese nula a sua distribuição é a distribuição qui quadrado com 8 graus de liberdade (df) e tem de se rejeitar a hipótese nula para valores grandes da estatística de teste.402 SE 0...890 0..703 -0. a relação entre os riscos de taxas de nascimento dos anos 79 e 86 é igual a . Acabamos de indicar como trabalhar com ele. o nascimento (1).424 0.089 0.065 0. pode testar se todos os efeitos do Nascimento covariável são zero. não é útil para testar para cada variável indicadora do Nascimento covariável. torna-se onde são os valores das variáveis de cada indicador .091 0.947 -0.799 -0. Use SPSS quando você faz as peças A en B desta tarefa.094 0.493 0. Desde o resultado das Wald é 18.423 0. Secção 7: Atribuição Antes de começar: consultar o texto do arquivo Sobre SPSS.025 0.911 df 8 1 1 1 1 1 1 1 1 Sig.715 -0.019 2.419 0.450 0. Da mesma forma.se o resultado de nascimento é de 78 e em outro lugar. De acordo com a fórmula a relação entre os riscos de taxas de nascimento dos anos 78 e 86 é igual a .420 0. para os respectivos resultados da covariável temos agora (possivelmente) diferentes (multiplicativo) e efeitos aqui no ano de nascimento 86 serve como valor de referência. .doc. respectivamente.

Você não tem que escrever um relatório para este trabalho.utwente . Para as covariáveis idade e escola (e Nascimento) decidir se você tomar as covariáveis categóricas como covariável (em caso afirmativo. Em caso de covariáveis categóricas você não precisa se preocupar com as variáveis indicadoras descrito na seção 6: SPSS apresenta essas variáveis indicador automaticamente. Seguir uma estratégia clara. . Use testes estatísticos.poortema @ ewi. a fim de selecionar as covariáveis. (1) é a distribuição da duração do aleitamento materno bem modelada por meio de uma distribuição de Weibull ou uma distribuição exponencial para os subgrupos escolhidos? (2) O modelo de riscos proporcionais de ajustar os dados? Parte B Agora vamos supor que o modelo de riscos proporcionais de Cox é válido para os dados de aleitamento materno.. Para fazer uma nomeação para o serviço: enviar um e-mail ( k. aspectos importantes: Tente explicar a duração variável dependente tão bom quanto possível. Ao invés de parcelas da função de sobrevivência você pode usar terrenos da função de risco ou em função da função de sobrevivência. Parte Um Selecione um número de subgrupos e parcelas de estudo da estimativa de Kaplan Meier da função de sobrevivência. a fim de responder às seguintes questões. nl ) ou anel (074) 4893379. mas se abstenha de incluir co-variáveis (variáveis explicativas) que parecem ser supérfluos. categóricas no menu de Regressão de Cox). Investigar dentro desse modelo em que o covariáveis dependentes) Duração variável (depende realmente. vá para etc . Apenas faça a sua saída do computador e suas próprias anotações com você para uma oral) de discussão (com o professor sobre as respostas das partes A e B...

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->