[R-es] interpretacion de la salida de un GLM()

giltrapo

2017-11-16 08:51:29 UTC

Hola, Eric.

Tu recuerdo iba bien encaminado.

Lo que ha ocurrido es que R ha creado variables *dummy* con los factores
que has introducido en tu modelo. De esta forma el valor del coeficiente
"intercept", la constante, sería la media de los valores de referencia de
ambas variables, que en este caso serían "f" y "u" (precisamente los
niveles que no ves en tu output, ya que se crean k - 1 variables *dummy*,
siendo k el número de niveles de cada variable).

Creo que la mejor forma de que entiendas qué significa esto a la hora de
interpretar tu modelo es haciendo el ejercicio de estimar nuevas
predicciones con esos datos.

Si te fijas, en tu modelo se han calculado cuatro coeficientes, el
"intercept" y los tres coeficientes correspondientes a las tres variables
dummy creadas, de forma que el modelo quedaría así:

complect(x) = B0 + B1*x(m) + B2*x(par) + B3*x(pp)

En este caso, al tratarse de variables cualitativas (factores), la x no
representa una cantidad, sino una cualidad, es decir, las características
concretas del individuo, que o están presentes o no lo están. Si está
presente, le asignamos un 1 y si no, un 0.

Por tanto, si un individuo es "f" y "u", entonces su puntuación en
"complect" se estimaría así (dejando aparte las transformaciones
pertinentes):

complect = B0 + B1*0(m) + B2*0(par) + B3*0(pp)

es decir, complect = 0.51438

Si quisieses estimar la puntuación de alguien que tiene los niveles "f" y
"par", lo harías así:

complect = B0 + B1*0(m) + B2*1(par) + B3*0(pp)

es decir, complect = 0.51438 - 0.01438

Si fuese alguien con los niveles "m" y "pp" sería:

complect = B0 + B1*1(m) + B2*0(par) + B3*1(pp)

es decir, complect = 0.51438 - 0.00515 - 0.01308

Y así sucesivamente.

Espero haberme explicado bien.

Por cierto, puedes ver cuáles son los niveles de referencia con la función
"contrasts". E incluso cambiarlos, en caso de que quieras un grupo control
distinto al que tienes ahora.

Saludos.

Jose Ignacio

Estimada comunidad, tengo una pregunta cuya respuesta no he podido
encontrar en la internet ... resulta que estoy usando GLM en R para ajustar
un modelo a unos datos de comprension lectora y tengo dudas con la salida
que me da R. Obtengo la siguiente salida y la pregunta es por el
significado de la letra justo fuera del parentesis del nombre del factor en
la tabla de coeficientes. Por ejemplo, aparece "factor(sex)m" ... esa "m"
(que es uno de los niveles del factor, el otro es "f"), que significa ahi ?
alguna vez lei (pero no puedo encontrarlo para estar seguro) que esa letra
mostraba el nivel que se ha ajustado primero y que se ha fijado para
calcular el beta ... o algo asi, es un recuerdo muy vago el que tengo ...
en el caso de "factor(proceduc)" hay 3 niveles: par, pp, y u. La pregunta
es la misma, que implican para la interpretacion de la tabla el hecho de
que par y pp aparezcan fuera del parentesis.
Muchas gracias por su ayuda desinteresada en tiempos en que todo es
interes,
Eric.
glm(formula = complect ~ factor(sexo) + factor(proceduc), family =
Gamma(link = "inverse"))
Min 1Q Median 3Q Max
-0.62774 0.00000 0.00259 0.00259 0.46758
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.51438 0.02294 22.426 <2e-16 ***
factor(sexo)m -0.00515 0.02470 -0.208 0.835
factor(proceduc)par -0.01438 0.04488 -0.320 0.750
factor(proceduc)pp -0.01308 0.02511 -0.521 0.604
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Gamma family taken to be 0.03571761)
Null deviance: 3.2601 on 81 degrees of freedom
Residual deviance: 3.2489 on 78 degrees of freedom
AIC: 87.93
Number of Fisher Scoring iterations: 4
_______________________________________________
R-help-es mailing list
https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]