La Regresión Logística
Este elemento es una ampliación de los cursos y guías de Lawi. Ofrece hechos, comentarios y análisis sobre este tema. [aioseo_breadcrumbs]
La regresión logística es un procedimiento de análisis multivariado para el análisis de variables dependientes dicotómicas, es decir, variables binarias con dos manifestaciones. Una modelización lineal de las probabilidades logarítmicas (logits) de la ocurrencia de x = 1 da como resultado una modelización no lineal de las probabilidades. Veremos que esta no linealidad es por un lado necesaria y útil, pero por otro lado conduce a diferencias sustanciales de interpretación en comparación con los métodos de regresión de OLS.Entre las Líneas En este trabajo, primero daremos una introducción a la lógica del procedimiento y presentaremos la interpretación de los resultados.Entre las Líneas En un segundo paso se presentan las propiedades matemáticas básicas de la regresión logística y se discuten las extensiones avanzadas (estandarización, efectos sobre las probabilidades, interacciones). La aplicación de la regresión logística se demuestra en la práctica con el ejemplo de la herencia educativa.Entre las Líneas En la última sección se señalan los errores frecuentes, especialmente en la interpretación (odds ratios, no linealidad, interacciones).
Introducción al procedimiento
En la investigación de las ciencias sociales se suelen investigar hechos que se representan en variables dicotómicas.
Más Información
Los objetos típicos de investigación son las decisiones o los estados resultantes. Por ejemplo, Hubert y Wolf (2007) utilizan regresiones logísticas para investigar los determinantes de la participación en la formación profesional continua, y Best (2008) analiza la decisión de los agricultores de convertir sus explotaciones a la agricultura ecológica. Una variable dicotómica se caracteriza por el hecho de que solo puede asumir dos estados. Como con la mayoría de los métodos basados en la regresión, es útil si la variable está codificada 0/1. Si asumimos que la variable se supone que indica si una persona tiene un diploma de secundaria o no, tendría sentido codificar “diploma de secundaria” con “1” y “sin diploma de secundaria” con “0” (es decir, “diploma de secundaria sí/no”).
El modelo de probabilidad lineal
Una forma bastante simple de investigar los determinantes de la calificación de entrada a la educación superior multivariante sería añadir una regresión MCO con la variable “Abitur sí/no”. La estimación de la dependencia Variableˆyist ya no es dicotómica, sino más bien métrica, pero puede relacionarse con la variable “Abitur sí/no” interpretándola como una probabilidad de que el encuestado tenga Abitur.Entre las Líneas En consecuencia, se supone que las variables independientes influyen en la probabilidad de ocurrenciaP(y=1)=ˆylinear:P(y=1)=β0+β1×1+β2×2+—+βkxk+ε.
En base a la interpretación vonˆyals probabilidad de ocurrencia y el modelado lineal, este procedimiento se llama “modelo de probabilidad lineal” (LPM). Por ejemplo, si utilizamos ALLBUS2 para estimar la probabilidad de que un encuestado obtenga el bachillerato en función del prestigio profesional del padre, obtenemos la recta de regresión que se muestra en la figura 1.3 Como vemos, según este modelo la probabilidad de obtener el bachillerato aumenta con el prestigio profesional del padre.
Basado en la experiencia de varios autores, mis opiniones, perspectivas y recomendaciones se expresarán a continuación (o en otros lugares de esta plataforma, respecto a las características en 2026 o antes, y el futuro de esta cuestión):
Puntualización
Sin embargo, la aplicación de laLPM también conduce a una serie de problemas graves (véase, por ejemplo, Ménard 1995, pp. 1-11 para una discusión más detallada):-Para ciertas formas dex se pueden estimar valores que se encuentran fuera del rango de valores definidos de probabilidades (0≤P(y=1)≤1).En el presente ejemplo, se predice una probabilidad negativa para los valores de prestigio de Treiman por debajo de 25 puntos.
📬Si este tipo de historias es justo lo que buscas, y quieres recibir actualizaciones y mucho contenido que no creemos encuentres en otro lugar, suscríbete a este substack. Es gratis, y puedes cancelar tu suscripción cuando quieras: Qué piensas de este contenido? Estamos muy interesados en conocer tu opinión sobre este texto, para mejorar nuestras publicaciones. Por favor, comparte tus sugerencias en los comentarios. Revisaremos cada uno, y los tendremos en cuenta para ofrecer una mejor experiencia.Véase También
Introducción a los Métodos de Investigación Cualitativa, Investigación de Métodos Mixtos, Investigación Cualitativa en Gestión Empresarial, Investigación Cualitativa en Educación, Investigación Estadística en Gestión Empresarial, Diseño de Investigación, Métodos de Investigación en Comunicación, Métodos de Investigación en Educación, Métodos de Investigación en Trabajo Social, Métodos de Investigación en Sociología, Investigación para Disertaciones
Regresión logística
▷ Esperamos que haya sido de utilidad. Si conoces a alguien que pueda estar interesado en este tema, por favor comparte con él/ella este contenido. Es la mejor forma de ayudar al Proyecto Lawi.
El enfoque de esta entrada se centra de nuevo en los modelos de regresión logística para datos de nivel individual, pero también se consideran los datos agregados o agrupados. El libro incluye discusiones detalladas sobre la bondad del ajuste, índices de eficiencia predictiva y coeficientes de regresión logística estandarizados, y se incluyen ejemplos que utilizan S.A.S. y S.P.S.S. Consideración más detallada de los datos agrupados en lugar de los datos por caso a lo largo del libro Discusión actualizada de las propiedades y uso apropiado de la bondad de las medidas de ajuste, análogos de R-cuadrado e índices de eficiencia predictiva Discusión del mal uso de las razones de probabilidad para representar las razones de riesgo, y de la sobredispersión y la subdispersión para los datos agrupados Cobertura actualizada de los modelos de regresión logística politómica ordenada y no ordenada.