Discussion:
[R-es] Warning en modelo ZINB
m***@unavarra.es
2018-04-09 16:34:39 UTC
Permalink
Buenas tardes,

Estoy estimando un modelo binomial negativo de ceros inflados (ZINB)
utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo me da el
siguiente aviso:
Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred

¿Sabéis que significa y si puedo usar el modelo aún con ese aviso? ¿Los
coeficientes son fiables?

Muchas gracias,

Miriam
Carlos J. Gil Bellosta
2018-04-09 16:48:30 UTC
Permalink
Hola, ¿qué tal?

El "warning" que comentas aparece en glm.fit precisamente cuando un
coeficiente diverge.

El aviso puede ser malo o irrelevante, depende. Puede que haya sido emitido
en algún paso intermedio del ajuste (por lo que no habría mayor problema).
O que afecte al ajuste entero. Uno de los síntomas de que el ajuste es malo
es que algún coeficiente de tu modelo es excesivamente grande. O que el
peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es lo mismo
en el contexto de un modelo inflado). Mira a ver qué pinta tienen los
coeficientes y si tienen cierto sentido a la vista de tus datos. Vigila los
extremadamente altos.

Si no estás segura de tus coeficientes, puedes implementar el modelo
generativamente vía stan/rstan. Es sencillo y tendrías buenos diagnósticos
de lo que esta ocurriendo.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com
Post by m***@unavarra.es
Buenas tardes,
Estoy estimando un modelo binomial negativo de ceros inflados (ZINB)
utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo me da el
Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
¿Sabéis que significa y si puedo usar el modelo aún con ese aviso? ¿Los
coeficientes son fiables?
Muchas gracias,
Miriam
_______________________________________________
R-help-es mailing list
https://stat.ethz.ch/mailman/listinfo/r-help-es
[[alternative HTML version deleted]]
m***@unavarra.es
2018-04-09 17:00:13 UTC
Permalink
Muchas gracias por la respuesta. He mirado y los coeficientes no son altos
pero sí tengo una gran cantidad de ceros en la variable dependiente (más
del 90%). Sin embargo, al incluir otro tipo de variables independientes no
me da ese aviso, dejando la misma variable dependiente.

¿Cómo podría utilizar stan/rstan de forma sencilla para diagnosticar el
modelo?

Muchas gracias
Post by Carlos J. Gil Bellosta
Hola, ¿qué tal?
El "warning" que comentas aparece en glm.fit precisamente cuando un
coeficiente diverge.
El aviso puede ser malo o irrelevante, depende. Puede que haya sido emitido
en algún paso intermedio del ajuste (por lo que no habría mayor problema).
O que afecte al ajuste entero. Uno de los síntomas de que el ajuste es malo
es que algún coeficiente de tu modelo es excesivamente grande. O que el
peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es lo mismo
en el contexto de un modelo inflado). Mira a ver qué pinta tienen los
coeficientes y si tienen cierto sentido a la vista de tus datos. Vigila los
extremadamente altos.
Si no estás segura de tus coeficientes, puedes implementar el modelo
generativamente vía stan/rstan. Es sencillo y tendrías buenos diagnósticos
de lo que esta ocurriendo.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
Post by m***@unavarra.es
Buenas tardes,
Estoy estimando un modelo binomial negativo de ceros inflados (ZINB)
utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo me da el
Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
¿Sabéis que significa y si puedo usar el modelo aún con ese aviso? ¿Los
coeficientes son fiables?
Muchas gracias,
Miriam
_______________________________________________
R-help-es mailing list
https://stat.ethz.ch/mailman/listinfo/r-help-es
Carlos J. Gil Bellosta
2018-04-09 17:59:50 UTC
Permalink
¿Podría ser que para algún nivel de alguna variable independiente
categórica solo hubiese ceros? En ese caso, casi seguro, aparecería ese
tipo de warning.
Post by m***@unavarra.es
Muchas gracias por la respuesta. He mirado y los coeficientes no son altos
pero sí tengo una gran cantidad de ceros en la variable dependiente (más
del 90%). Sin embargo, al incluir otro tipo de variables independientes no
me da ese aviso, dejando la misma variable dependiente.
¿Cómo podría utilizar stan/rstan de forma sencilla para diagnosticar el
modelo?
Muchas gracias
Post by Carlos J. Gil Bellosta
Hola, ¿qué tal?
El "warning" que comentas aparece en glm.fit precisamente cuando un
coeficiente diverge.
El aviso puede ser malo o irrelevante, depende. Puede que haya sido emitido
en algún paso intermedio del ajuste (por lo que no habría mayor
problema).
Post by Carlos J. Gil Bellosta
O que afecte al ajuste entero. Uno de los síntomas de que el ajuste es malo
es que algún coeficiente de tu modelo es excesivamente grande. O que el
peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es lo
mismo
Post by Carlos J. Gil Bellosta
en el contexto de un modelo inflado). Mira a ver qué pinta tienen los
coeficientes y si tienen cierto sentido a la vista de tus datos. Vigila los
extremadamente altos.
Si no estás segura de tus coeficientes, puedes implementar el modelo
generativamente vía stan/rstan. Es sencillo y tendrías buenos
diagnósticos
Post by Carlos J. Gil Bellosta
de lo que esta ocurriendo.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
Post by m***@unavarra.es
Buenas tardes,
Estoy estimando un modelo binomial negativo de ceros inflados (ZINB)
utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo me da el
Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
¿Sabéis que significa y si puedo usar el modelo aún con ese aviso? ¿Los
coeficientes son fiables?
Muchas gracias,
Miriam
_______________________________________________
R-help-es mailing list
https://stat.ethz.ch/mailman/listinfo/r-help-es
[[alternative HTML version deleted]]
m***@unavarra.es
2018-04-09 18:09:29 UTC
Permalink
¿Quieres decir que para un nivel de una variable categorica todas las
observaciones de la variable respuesta sean ceros?

Gracias
Post by Carlos J. Gil Bellosta
¿Podría ser que para algún nivel de alguna variable independiente
categórica solo hubiese ceros? En ese caso, casi seguro, aparecería ese
tipo de warning.
Post by m***@unavarra.es
Muchas gracias por la respuesta. He mirado y los coeficientes no son altos
pero sí tengo una gran cantidad de ceros en la variable dependiente (más
del 90%). Sin embargo, al incluir otro tipo de variables independientes no
me da ese aviso, dejando la misma variable dependiente.
¿Cómo podría utilizar stan/rstan de forma sencilla para diagnosticar el
modelo?
Muchas gracias
Post by Carlos J. Gil Bellosta
Hola, ¿qué tal?
El "warning" que comentas aparece en glm.fit precisamente cuando un
coeficiente diverge.
El aviso puede ser malo o irrelevante, depende. Puede que haya sido emitido
en algún paso intermedio del ajuste (por lo que no habría mayor
problema).
Post by Carlos J. Gil Bellosta
O que afecte al ajuste entero. Uno de los síntomas de que el ajuste es malo
es que algún coeficiente de tu modelo es excesivamente grande. O que
el
Post by Carlos J. Gil Bellosta
peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es lo
mismo
Post by Carlos J. Gil Bellosta
en el contexto de un modelo inflado). Mira a ver qué pinta tienen los
coeficientes y si tienen cierto sentido a la vista de tus datos.
Vigila
Post by Carlos J. Gil Bellosta
los
extremadamente altos.
Si no estás segura de tus coeficientes, puedes implementar el modelo
generativamente vía stan/rstan. Es sencillo y tendrías buenos
diagnósticos
Post by Carlos J. Gil Bellosta
de lo que esta ocurriendo.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
Post by m***@unavarra.es
Buenas tardes,
Estoy estimando un modelo binomial negativo de ceros inflados (ZINB)
utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo me
da
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
¿Sabéis que significa y si puedo usar el modelo aún con ese aviso?
¿Los
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
coeficientes son fiables?
Muchas gracias,
Miriam
_______________________________________________
R-help-es mailing list
https://stat.ethz.ch/mailman/listinfo/r-help-es
Carlos J. Gil Bellosta
2018-04-09 18:17:17 UTC
Permalink
Si, creo que el motivo del warning puede ser ese. Es hipotético, pero
plausible. Sobre todo cuando tienes más de un 90% de ceros.

El coeficiente de ese nivel para el modelo de la mixtura (ceros vs binomial
negativa) sería infinito. Y de ahí el warning.
Post by m***@unavarra.es
¿Quieres decir que para un nivel de una variable categorica todas las
observaciones de la variable respuesta sean ceros?
Gracias
Post by Carlos J. Gil Bellosta
¿Podría ser que para algún nivel de alguna variable independiente
categórica solo hubiese ceros? En ese caso, casi seguro, aparecería ese
tipo de warning.
Post by m***@unavarra.es
Muchas gracias por la respuesta. He mirado y los coeficientes no son altos
pero sí tengo una gran cantidad de ceros en la variable dependiente (más
del 90%). Sin embargo, al incluir otro tipo de variables independientes no
me da ese aviso, dejando la misma variable dependiente.
¿Cómo podría utilizar stan/rstan de forma sencilla para diagnosticar el
modelo?
Muchas gracias
Post by Carlos J. Gil Bellosta
Hola, ¿qué tal?
El "warning" que comentas aparece en glm.fit precisamente cuando un
coeficiente diverge.
El aviso puede ser malo o irrelevante, depende. Puede que haya sido emitido
en algún paso intermedio del ajuste (por lo que no habría mayor
problema).
Post by Carlos J. Gil Bellosta
O que afecte al ajuste entero. Uno de los síntomas de que el ajuste es malo
es que algún coeficiente de tu modelo es excesivamente grande. O que
el
Post by Carlos J. Gil Bellosta
peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es lo
mismo
Post by Carlos J. Gil Bellosta
en el contexto de un modelo inflado). Mira a ver qué pinta tienen los
coeficientes y si tienen cierto sentido a la vista de tus datos.
Vigila
Post by Carlos J. Gil Bellosta
los
extremadamente altos.
Si no estás segura de tus coeficientes, puedes implementar el modelo
generativamente vía stan/rstan. Es sencillo y tendrías buenos
diagnósticos
Post by Carlos J. Gil Bellosta
de lo que esta ocurriendo.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
Post by m***@unavarra.es
Buenas tardes,
Estoy estimando un modelo binomial negativo de ceros inflados (ZINB)
utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo me
da
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
¿Sabéis que significa y si puedo usar el modelo aún con ese aviso?
¿Los
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
coeficientes son fiables?
Muchas gracias,
Miriam
_______________________________________________
R-help-es mailing list
https://stat.ethz.ch/mailman/listinfo/r-help-es
[[alternative HTML version deleted]]
m***@unavarra.es
2018-04-09 18:20:36 UTC
Permalink
En ese caso, ¿tendría sentido el modelo? o ¿debería quitar esa variable
categórica?
Muchas gracias
Post by Carlos J. Gil Bellosta
Si, creo que el motivo del warning puede ser ese. Es hipotético, pero
plausible. Sobre todo cuando tienes más de un 90% de ceros.
El coeficiente de ese nivel para el modelo de la mixtura (ceros vs binomial
negativa) sería infinito. Y de ahí el warning.
Post by m***@unavarra.es
¿Quieres decir que para un nivel de una variable categorica todas las
observaciones de la variable respuesta sean ceros?
Gracias
Post by Carlos J. Gil Bellosta
¿Podría ser que para algún nivel de alguna variable independiente
categórica solo hubiese ceros? En ese caso, casi seguro, aparecería
ese
Post by Carlos J. Gil Bellosta
tipo de warning.
Post by m***@unavarra.es
Muchas gracias por la respuesta. He mirado y los coeficientes no son altos
pero sí tengo una gran cantidad de ceros en la variable dependiente
(más
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
del 90%). Sin embargo, al incluir otro tipo de variables
independientes
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
no
me da ese aviso, dejando la misma variable dependiente.
¿Cómo podría utilizar stan/rstan de forma sencilla para diagnosticar
el
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
modelo?
Muchas gracias
Post by Carlos J. Gil Bellosta
Hola, ¿qué tal?
El "warning" que comentas aparece en glm.fit precisamente cuando un
coeficiente diverge.
El aviso puede ser malo o irrelevante, depende. Puede que haya sido emitido
en algún paso intermedio del ajuste (por lo que no habría mayor
problema).
Post by Carlos J. Gil Bellosta
O que afecte al ajuste entero. Uno de los síntomas de que el ajuste
es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
malo
es que algún coeficiente de tu modelo es excesivamente grande. O
que
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Post by Carlos J. Gil Bellosta
peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es
lo
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
mismo
Post by Carlos J. Gil Bellosta
en el contexto de un modelo inflado). Mira a ver qué pinta tienen
los
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
coeficientes y si tienen cierto sentido a la vista de tus datos.
Vigila
Post by Carlos J. Gil Bellosta
los
extremadamente altos.
Si no estás segura de tus coeficientes, puedes implementar el
modelo
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
generativamente vía stan/rstan. Es sencillo y tendrías buenos
diagnósticos
Post by Carlos J. Gil Bellosta
de lo que esta ocurriendo.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
Post by m***@unavarra.es
Buenas tardes,
Estoy estimando un modelo binomial negativo de ceros inflados
(ZINB)
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo
me
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
da
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
¿Sabéis que significa y si puedo usar el modelo aún con ese aviso?
¿Los
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
coeficientes son fiables?
Muchas gracias,
Miriam
_______________________________________________
R-help-es mailing list
https://stat.ethz.ch/mailman/listinfo/r-help-es
m***@unavarra.es
2018-04-09 18:35:29 UTC
Permalink
Hola de nuevo Carlos, he probado a quitar esa variable categórica y me
sigue dando el aviso...
Post by Carlos J. Gil Bellosta
Si, creo que el motivo del warning puede ser ese. Es hipotético, pero
plausible. Sobre todo cuando tienes más de un 90% de ceros.
El coeficiente de ese nivel para el modelo de la mixtura (ceros vs binomial
negativa) sería infinito. Y de ahí el warning.
Post by m***@unavarra.es
¿Quieres decir que para un nivel de una variable categorica todas las
observaciones de la variable respuesta sean ceros?
Gracias
Post by Carlos J. Gil Bellosta
¿Podría ser que para algún nivel de alguna variable independiente
categórica solo hubiese ceros? En ese caso, casi seguro, aparecería
ese
Post by Carlos J. Gil Bellosta
tipo de warning.
Post by m***@unavarra.es
Muchas gracias por la respuesta. He mirado y los coeficientes no son altos
pero sí tengo una gran cantidad de ceros en la variable dependiente
(más
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
del 90%). Sin embargo, al incluir otro tipo de variables
independientes
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
no
me da ese aviso, dejando la misma variable dependiente.
¿Cómo podría utilizar stan/rstan de forma sencilla para diagnosticar
el
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
modelo?
Muchas gracias
Post by Carlos J. Gil Bellosta
Hola, ¿qué tal?
El "warning" que comentas aparece en glm.fit precisamente cuando un
coeficiente diverge.
El aviso puede ser malo o irrelevante, depende. Puede que haya sido emitido
en algún paso intermedio del ajuste (por lo que no habría mayor
problema).
Post by Carlos J. Gil Bellosta
O que afecte al ajuste entero. Uno de los síntomas de que el ajuste
es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
malo
es que algún coeficiente de tu modelo es excesivamente grande. O
que
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Post by Carlos J. Gil Bellosta
peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es
lo
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
mismo
Post by Carlos J. Gil Bellosta
en el contexto de un modelo inflado). Mira a ver qué pinta tienen
los
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
coeficientes y si tienen cierto sentido a la vista de tus datos.
Vigila
Post by Carlos J. Gil Bellosta
los
extremadamente altos.
Si no estás segura de tus coeficientes, puedes implementar el
modelo
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
generativamente vía stan/rstan. Es sencillo y tendrías buenos
diagnósticos
Post by Carlos J. Gil Bellosta
de lo que esta ocurriendo.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
Post by m***@unavarra.es
Buenas tardes,
Estoy estimando un modelo binomial negativo de ceros inflados
(ZINB)
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo
me
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
da
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
¿Sabéis que significa y si puedo usar el modelo aún con ese aviso?
¿Los
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
coeficientes son fiables?
Muchas gracias,
Miriam
_______________________________________________
R-help-es mailing list
https://stat.ethz.ch/mailman/listinfo/r-help-es
Carlos J. Gil Bellosta
2018-04-10 19:16:11 UTC
Permalink
Hola, ¿qué tal?

Pues casi seguro que tienes un caso de "separación perfecta". Aunque no
exista una variable única (p.e., un nivel en una variable categórica) que
tenga asociados solo valores 0, es posible que exista una combinación
lineal de variables que separe regiones donde solo hay ceros del resto de
las observaciones.

Un modelo inflado contiene internamente algo muy parecido a una regresión
logística y te estás encontrando un problema muy parecido a este
<https://www.datanalytics.com/2010/10/25/una-solucion-al-problema-de-la-separacion-perfecta-con-regresiones-logisticas/>.
Existe código en R para solucionar ese problema en el contexto de la
logística (penalizaciones a lo Jeffrey, incluso ridge/lasso), pero no creo
que se hayan incorporado en modelos más específicos como los inflados.

No sé si tu paquete te permite introducir penalizaciones en parámetros (que
es la vía que señalaba más arriba). La otra opción es la ruta "fully
bayesian", como aquí
<https://github.com/stan-dev/example-models/tree/master/BPA/Ch.12>.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com
Post by m***@unavarra.es
Hola de nuevo Carlos, he probado a quitar esa variable categórica y me
sigue dando el aviso...
Post by Carlos J. Gil Bellosta
Si, creo que el motivo del warning puede ser ese. Es hipotético, pero
plausible. Sobre todo cuando tienes más de un 90% de ceros.
El coeficiente de ese nivel para el modelo de la mixtura (ceros vs binomial
negativa) sería infinito. Y de ahí el warning.
Post by m***@unavarra.es
¿Quieres decir que para un nivel de una variable categorica todas las
observaciones de la variable respuesta sean ceros?
Gracias
Post by Carlos J. Gil Bellosta
¿Podría ser que para algún nivel de alguna variable independiente
categórica solo hubiese ceros? En ese caso, casi seguro, aparecería
ese
Post by Carlos J. Gil Bellosta
tipo de warning.
Post by m***@unavarra.es
Muchas gracias por la respuesta. He mirado y los coeficientes no son altos
pero sí tengo una gran cantidad de ceros en la variable dependiente
(más
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
del 90%). Sin embargo, al incluir otro tipo de variables
independientes
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
no
me da ese aviso, dejando la misma variable dependiente.
¿Cómo podría utilizar stan/rstan de forma sencilla para diagnosticar
el
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
modelo?
Muchas gracias
Post by Carlos J. Gil Bellosta
Hola, ¿qué tal?
El "warning" que comentas aparece en glm.fit precisamente cuando un
coeficiente diverge.
El aviso puede ser malo o irrelevante, depende. Puede que haya sido emitido
en algún paso intermedio del ajuste (por lo que no habría mayor
problema).
Post by Carlos J. Gil Bellosta
O que afecte al ajuste entero. Uno de los síntomas de que el ajuste
es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
malo
es que algún coeficiente de tu modelo es excesivamente grande. O
que
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Post by Carlos J. Gil Bellosta
peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es
lo
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
mismo
Post by Carlos J. Gil Bellosta
en el contexto de un modelo inflado). Mira a ver qué pinta tienen
los
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
coeficientes y si tienen cierto sentido a la vista de tus datos.
Vigila
Post by Carlos J. Gil Bellosta
los
extremadamente altos.
Si no estás segura de tus coeficientes, puedes implementar el
modelo
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
generativamente vía stan/rstan. Es sencillo y tendrías buenos
diagnósticos
Post by Carlos J. Gil Bellosta
de lo que esta ocurriendo.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
Post by m***@unavarra.es
Buenas tardes,
Estoy estimando un modelo binomial negativo de ceros inflados
(ZINB)
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo
me
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
da
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
¿Sabéis que significa y si puedo usar el modelo aún con ese aviso?
¿Los
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
coeficientes son fiables?
Muchas gracias,
Miriam
_______________________________________________
R-help-es mailing list
https://stat.ethz.ch/mailman/listinfo/r-help-es
[[alternative HTML version deleted]]
Miriam Alzate
2018-04-11 16:38:28 UTC
Permalink
Muchas gracias Carlos por la respuesta y enlaces. Entiendo lo qué
significa el tema de separación perfecta pero no logro entender cómo
solucionarlo, estoy intentado seguir los enlaces pero me parece bastante
complicado...
Post by Carlos J. Gil Bellosta
Hola, ¿qué tal?
Pues casi seguro que tienes un caso de "separación perfecta".  Aunque
no exista una variable única (p.e., un nivel en una variable
categórica) que tenga asociados solo valores 0, es posible que exista
una combinación lineal de variables que separe regiones donde solo hay
ceros del resto de las observaciones.
Un modelo inflado contiene internamente algo muy parecido a una
regresión logística y te estás encontrando un problema muy parecido a
este
<https://www.datanalytics.com/2010/10/25/una-solucion-al-problema-de-la-separacion-perfecta-con-regresiones-logisticas/>.
Existe código en R para solucionar ese problema en el contexto de la
logística (penalizaciones a lo Jeffrey, incluso ridge/lasso), pero no
creo que se hayan incorporado en modelos más específicos como los
inflados.
No sé si tu paquete te permite introducir penalizaciones en parámetros
(que es la vía que señalaba más arriba). La otra opción es la ruta
"fully bayesian", como aquí
<https://github.com/stan-dev/example-models/tree/master/BPA/Ch.12>.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
Hola de nuevo Carlos, he probado a quitar esa variable categórica y me
sigue dando el aviso...
Post by Carlos J. Gil Bellosta
Si, creo que el motivo del warning puede ser ese. Es hipotético,
pero
Post by Carlos J. Gil Bellosta
plausible. Sobre todo cuando tienes más de un 90% de ceros.
El coeficiente de ese nivel para el modelo de la mixtura (ceros vs binomial
negativa) sería infinito. Y de ahí el warning.
Post by m***@unavarra.es
¿Quieres decir que para un nivel de una variable categorica
todas las
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
observaciones de la variable respuesta sean ceros?
Gracias
Post by Carlos J. Gil Bellosta
¿Podría ser que para algún nivel de alguna variable independiente
categórica solo hubiese ceros? En ese caso, casi seguro,
aparecería
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
ese
Post by Carlos J. Gil Bellosta
tipo de warning.
Post by m***@unavarra.es
Muchas gracias por la respuesta. He mirado y los
coeficientes no son
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
altos
pero sí tengo una gran cantidad de ceros en la variable
dependiente
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
(más
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
del 90%). Sin embargo, al incluir otro tipo de variables
independientes
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
no
me da ese aviso, dejando la misma variable dependiente.
¿Cómo podría utilizar stan/rstan de forma sencilla para
diagnosticar
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
modelo?
Muchas gracias
El Lun, 9 de Abril de 2018, 18:48, Carlos J. Gil Bellosta
Post by Carlos J. Gil Bellosta
Hola, ¿qué tal?
El "warning" que comentas aparece en glm.fit precisamente
cuando un
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
coeficiente diverge.
El aviso puede ser malo o irrelevante, depende. Puede que
haya sido
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
emitido
en algún paso intermedio del ajuste (por lo que no habría
mayor
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
problema).
Post by Carlos J. Gil Bellosta
O que afecte al ajuste entero. Uno de los síntomas de que
el ajuste
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
malo
es que algún coeficiente de tu modelo es excesivamente
grande. O
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
que
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Post by Carlos J. Gil Bellosta
peso correspondiente a tus ceros esté muy próximo a 0 o 1
(que es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
lo
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
mismo
Post by Carlos J. Gil Bellosta
en el contexto de un modelo inflado). Mira a ver qué pinta
tienen
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
los
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
coeficientes y si tienen cierto sentido a la vista de tus
datos.
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Vigila
Post by Carlos J. Gil Bellosta
los
extremadamente altos.
Si no estás segura de tus coeficientes, puedes implementar el
modelo
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
generativamente vía stan/rstan. Es sencillo y tendrías buenos
diagnósticos
Post by Carlos J. Gil Bellosta
de lo que esta ocurriendo.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
El lun., 9 abr. 2018 a las 18:34,
Post by m***@unavarra.es
Buenas tardes,
Estoy estimando un modelo binomial negativo de ceros inflados
(ZINB)
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
utilizando el comando zeroinfl() del paquete pscl. Al
ejecutarlo
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
me
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
da
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
el
Warning: glm.fit: fitted probabilities numerically 0 or 1
occurred
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
¿Sabéis que significa y si puedo usar el modelo aún con
ese aviso?
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
¿Los
Post by Carlos J. Gil Bellosta
Post by m***@unavarra.es
coeficientes son fiables?
Muchas gracias,
Miriam
_______________________________________________
R-help-es mailing list
https://stat.ethz.ch/mailman/listinfo/r-help-es
[[alternative HTML version deleted]]

Loading...