*******************MODELOS LOGIT Y PROBIT EN STATA ********************* *Prof. Catalina Canals Cifuentes clear all cd "C:\Users\Andrea\Dropbox" use CASEN2013_logit_probit.dta *Ejercicio: predecir estar ocupado (vs cesante e inactivo) a partir de la *escolaridad, el sexo la zona y la nota que le pone la persona a la salud *Variable Dependiente: Actv1 *Variable independientes: esc (años de escolaridad), mujer (0 y 1), *urbano (0 y 1), y nota en salud (de 1 a 7) *I. LOGIT *ESTIMAR COEFICIENTES BETA DE LA REGRESION logit Ocupado esc mujer urbano s16 // logit indica que se realice una regresión *logistica, pero que incique los coeficientes beta. La primera variable que va a * continuación es la dependiente y las variables siguientes son las independientes. *INTERPRETACIÓN *La Salida de resultados nos permite ver 1) el Pseudo R cuadrado de McFadden: *en este caso el ajuste es 0,09 lo cual no es mucho mejor que el modelo nulo. *2)"Prob>chi2" nos presenta el valor P para el Test de la razón de verosimilitud *que prueba la H0 de que todos los coeficientes beta del modelo (los efectos) *son =0. *con 99% de confianza podemos rechazar dicha hipotesis, evidenciando de * que nuestras variables inciden. *Luego en la tabla de abajo, en la columna "P>z" vemos el valor P *del test que prueba la H0 de que el coeficiente de cada variable es =0. *En este caso con 99% de confianza rechazamos la H0 para todas las variables, *excepto urbano, indicando que la escolaridad, ser mujer, y la autopercepcion *de la salud inciden en estar ocupado. *Finalmente tenemos los coeficientes beta. Estos nos indican que (1) Al aumentar *la escolaridad, aumenta la probabilidad de estar ocupado; (2) al ser *mujer disminuye la probabilidad, (3) al tener autopercepcion de buena salud *aumenta la probabilidad de estar ocupado. *ESTIMAR e^BETA DE LA REGRESION logistic Ocupado esc mujer urbano s16 // logistic indica que se realice una *regresión logistica, pero que indique en vez de beta, e^beta. La primera *variable que va a continuación es la dependiente y las variables siguientes son *las independientes. *INTERPRETACION *La Salida de resultados nos permite ver 1) el Pseudo R cuadrado de McFadden y *2)"Prob>chi2", los cuales coinciden con los de la salida anterior. *Luego en la tabla de abajo, en la columna "P>z" vemos el valor P *del test que prueba la H0 de que el coeficiente beta de cada variable es =0. *(lo que es equivalente al H0 de que e(beta)=1). Estos valores P son los mismos *que en la tabla anterior. *Finalmente tenemos los valores de e^beta (Odd Ratio) en la columna Odd ratio. * Estos nos indican que (1) Al aumentar *la escolaridad en 1, aumentan los odd en 11%; (2) al ser *mujer disminuye n los odds en 67% respecto a ser hombre, (3) al tener *1 punto más en la nota de buena salud (de 1 a 7) aumentan los odds en 6,5%. *ESTIMAR LOS EFECTOS MARGINALES PROMEDIO margins, dydx(*) // margins refiere a efecto marginal. Solo se puede usar el *comando cuando antes se estimó la regresion, entonces la estimacion de los *efectos marginales se basa en la ultima regresion realizada. dydx quiere decir *que es el efecto margina de como varia y (dy) cuando aumenta x en 1 (dx). El *asterizco entre paréntesis indica que interesa estimar el efecto para todas *las variables. *INTERPRETACION *La Salida de resultados nos permite ver en la columna "P>z" vemos el valor P *del test que prueba la H0 de que el coeficiente beta de cada variable es =0. *(lo que es equivalente al H0 de que e(beta)=1). Estos valores P son los mismos *que en las tablas anteriores. *Finalmente tenemos los valores de los efectos marginales promedio en la *columna dy/dx. Estos nos indican que (1) Al aumentar *la escolaridad en 1 año, en promedio la probabilidad de estar ocupado aumenta *en 2,4% ; (2) al ser mujer, respecto a ser hombre, *la probabilidad de estar ocupado es en promedio 24% menor, (3) al tener *1 punto más en la nota de buena salud (de 1 a 7) aumenta la probabilidad de *estar ocupado en 1,4% en promedio. **R CUADRADO ssc install fitstat ssc install estout *Mc Fadden y McFaden Ajustado estadd fitstat *Cox & Snell estadd coxsnell *Nagelkerke estadd nagelkerke *El ajuste del modelo no es muy superior al del modelo nulo. *HOSMER-LEMESHOW estat gof, group(10) *Se rechaza H0: las clasificaciones osbervadas difieren de las esperadas *% casos bien clasificados estat classification *Clasifica bien a la mayoria de los casos; el % declasificacion correcta es *similar para los ocupados y los no ocupados *II. PROBIT *ESTIMAR COEFICIENTES BETA probit Ocupado esc mujer urbano s16 // probit indica que se realice un modelo *probit, y que indique los coeficientes beta. La primera variable que va a * continuación es la dependiente y las variables siguientes son las independientes. *INTERPRETACIÓN *La Salida de resultados nos permite ver 1) el Pseudo R cuadrado de McFadden: *en este caso el ajuste es 0,09 lo cual no es mucho mejor que el modelo nulo. *2)"Prob>chi2" nos presenta el valor P para el Test de la razón de verosimilitud *que prueba la H0 de que todos los coeficientes beta del modelo (los efectos) *son =0. *con 99% de confianza podemos rechazar dicha hipotesis, evidenciando de * que nuestras variables inciden. *Luego en la tabla de abajo, en la columna "P>z" vemos el valor P *del test que prueba la H0 de que el coeficiente de cada variable es =0. *En este caso con 99% de confianza rechazamos la H0 para todas las variables, *excepto urbano, indicando que la escolaridad, ser mujer, y la autopercepcion *de la salud inciden en estar ocupado. *Finalmente tenemos los coeficientes beta. Estos nos indican que (1) Al aumentar *la escolaridad, aumenta la probabilidad de estar ocupado; (2) al ser *mujer disminuye la probabilidad, (3) al tener autopercepcion de buena salud *aumenta la probabilidad de estar ocupado. *ESTIMAR LOS EFECTOS MARGINALES PROMEDIO margins, dydx(*) // margins refiere a efecto marginal. Solo se puede usar el *comando cuando antes se estimó la regresion, entonces la estimacion de los *efectos marginales se basa en la ultima regresion realizada. dydx quiere decir *que es el efecto marginal de como varia y (dy) cuando aumenta x en 1 (dx). El *asterizco entre paréntesis indica que interesa estimar el efecto para todas *las variables. *INTERPRETACION *La Salida de resultados nos permite ver en la columna "P>z" vemos el valor P *del test que prueba la H0 de que el coeficiente beta de cada variable es =0. * Estos valores P son los mismos de la tabla anterior. *Finalmente tenemos los valores de los efectos marginales promedio en la *columna dy/dx. Estos nos indican que (1) Al aumentar *la escolaridad en 1 año, en promedio la probabilidad de estar ocupado aumenta *en 2,4%; (2) al ser mujer, respecto a ser hombre, *la probabilidad de estar ocupado es en promedio 25% menor, (3) al tener *1 punto más en la nota de buena salud (de 1 a 7) aumenta la probabilidad de *estar ocupado en 1,4% en promedio. **R CUADRADO *Mc Fadden y McFaden Ajustado estadd fitstat *Cox & Snell estadd coxsnell *Nagelkerke estadd nagelkerke *El ajuste del modelo no es muy superior al del modelo nulo. *HOSMER-LEMESHOW estat gof, group(10) *Se rechaza H0: las clasificaciones osbervadas difieren de las esperadas *% casos bien clasificados estat classification *Clasifica bien a la mayoria de los casos; el % declasificacion correcta es *similar para los ocupados y los no ocupados ***TANTO LOS INDICADORES DE AJUSTE COMO LOS EMP SON MUY SIMILARES EN LOS MODELOS *PROBIT Y LOGIT