domingo, 24 de julio de 2016

Regresión logística multinomial y ordinal: Fundamentos y aplicación

(Reseña publicada en la WEB de la SEPEAP el 16 de Septiembre de 2005)

La regresión logística viene definida por la existencia de una variable dependiente con dos categorías y una o mas variables independientes que pueden ser tanto categóricas como cuantitativas.
En ocasiones el modelo de regresión logística precisa incluir como variable dependiente mas de dos categorías (c); en este caso se definen c-1 logit o ecuaciones simultáneas, cada uno de ellos comparando una determinada categoría con la definida como de referencia, que en el caso particular de la regresión logística multinomial debe ser la categoría de valor mas bajo.

Es importante tener claro que el modelo mas simple de esta regresión, donde la variable independiente es categórica binaria, equivale a una tabla de contingencia (χ2). Sin embargo el modelo se va a ir complicando conforme añadamos categorías a la variable independiente o introduzcamos un predictor (variable independiente) cuantitativo.
El paquete estadístico SPSS tiene implementado esta función a través de la rutina NOMREG. Hay que decir que los predictores binarios, lo mismo que los cuantitativos se introducen como covariables (se escriben detrás de la instrucción with). Los predictores con mas de 2 categorías se introducen como factores (se escriben detrás de la instrucción by). Al igual que ocurría en la regresión logística la introducción de un predictor con mas de dos categorías supone la generación de c-1 variables ficticias (dummy) que con carácter binario (0, 1), representan el efecto de una categoría con respecto a la de referencia.
La regresión logística ordinal supone asumir que las categorías de la variable dependiente tienen un orden dado, lo que supone una información que desestimaríamos si la considerásemos solo como una variable cuantitativa (regresión lineal) o categórica no binaria (multinomial). Para este tipo de análisis el paquete SPSS dispone de la instrucción PLUM. Este tipo de regresión a diferencia de la previamente tratada no supone definir logits respecto a una categoría de referencia, sino que se trabaja con una categoría no representada y codificada con el valor mayor. La Pr (Y ≤ s) se denomina probabilidad acumulativa de la respuesta s; lo que permite definir la odds acumulativa de la respuesta s:


no presentan el fenómeno de sobredispersión o infradispersión. Este modelo es el modelo de  regresión de Poisson que se utiliza fundamentalmente para ajustar tasas de incidencia. Como elemento diferencial decir que este tipo de modelo acostumbra a incluir un término adicional en su formulación que representa la variable de exposición o tiempo (t).

Prof. Dr. José Uberos Fernández

No hay comentarios:

Publicar un comentario