▷ Sabiduría semanal que puedes leer en pocos minutos. Añade nuestra revista gratuita a tu bandeja de entrada. Lee gratis nuestras revistas de Derecho empresarial, Emprender, Carreras, Liderazgo, Dinero, Startups, Políticas, Ecología, Ciencias sociales, Humanidades, Marketing digital, Ensayos, y Sectores e industrias.

Conjuntos de Datos en Gran Escala

▷ Lee Gratis Nuestras Revistas

Los Conjuntos de Datos en Gran Escala

Este elemento es una ampliación de los cursos y guías de Lawi. Ofrece hechos, comentarios y análisis sobre este tema. [aioseo_breadcrumbs]

Los Conjuntos de Datos en Gran Escala y la Justicia Social

Nota: véase información relativa a las Consideraciones Éticas de la Realización de Investigaciones con Grupos Marginados.

La historia muestra repetidamente que la gente no es muy buena en notar sus prejuicios, y un conglomerado de prejuicios crea normas sociales con consecuencias nefastas para las personas que no están en posiciones de poder. Afortunadamente, la ciencia social y su pensamiento científico sistemático y análisis proporcionan un lugar para cuestionar las normas sociales y los impactos en las personas.Si, Pero: Pero la ciencia social no es una bala de plata. Los científicos sociales son también personas empapadas de las mismas normas sociales que pueden enmarcar sin saberlo la investigación, ya sea cualitativa o cuantitativa.Entre las Líneas En este capítulo se examina la forma en que los conjuntos de datos en gran escala pueden utilizarse para investigar las pautas de injusticia social en la educación y se demuestran estos procedimientos utilizando un caso de oportunidades de programas de estudio de la escuela secundaria.

Datos en gran escala: Riesgos y ventajas

Sólo en 1994 se distribuyó ampliamente un libro bajo el auspicio de las ciencias sociales que malinterpretó los resultados para concluir que los estudiantes americanos de ascendencia anglosajona estaban biológicamente predispuestos a ser más inteligentes que los estudiantes de ascendencia africana (“The bell curve: Intelligence and class structure in American life”, de Herrnstein & Murray).

Detalles

Los autores basaron estas conclusiones en datos a gran escala sobre las pautas de rendimiento (véase una definición en el diccionario y más detalles, en la plataforma general, sobre rendimientos) de los estudiantes estadounidenses. Lo que los autores no reconocieron fueron sus propios sesgos, impregnados de una historia de supremacía blanca, al no reconocer las generaciones de leyes estadounidenses que hacían ilegal que grupos enteros de estadounidenses leyeran o fueran a la escuela . El hecho de no incorporar estos factores contextuales creó un error “falso-positivo” cuando sólo se consideraron las diferencias por identidad racial a nivel individual en los resultados de los logros.

Más Información

Las identidades raciales y étnicas no deben evaluarse a nivel individual, ya que no se trata de un factor psicológico individual ni de un atributo estático, sino de una medida utilizada para reflejar normas sociales dinámicas. Afortunadamente, un estimado grupo de científicos sociales reunió sus talentos colectivos para señalar los principales errores estadísticos del libro y volvió a probar los mismos datos con el contexto incluido para mostrar claramente que las diferencias raciales en los logros eran artefactos del contexto y nada de la biología (Fisher et al., 1996).

Una de las ventajas del trabajo cuantitativo a gran escala es que puede ser repetido y replicado. Con la replicación, los investigadores, como los de la Universidad de California en Berkeley (es decir, Fisher y otros, 1996), pueden comprobar los resultados de otros y probar cómo el sesgo de las variables omitidas puede influir en los resultados y explicar cómo las variables omitidas proporcionan una lente en la que interpretar los resultados. Es en la interpretación donde se desarrollan las políticas educativas, por lo que es responsabilidad de los investigadores probar estos sesgos.

Los conjuntos de datos a gran escala también pueden revelar patrones que no se ven fácilmente a simple vista.Entre las Líneas En el ejemplo anterior, si bien se puede pensar que la tez se observa (aunque esto está impregnado de su propio conjunto de contextos y percepciones erróneas), el racismo histórico no es observable. Para probar el impacto de esas ideas conceptuales, los investigadores piensan profundamente en qué variables observables pueden utilizarse para representar hechos sociales difíciles de observar.Entre las Líneas En el caso anterior, fue la inclusión de una constelación de medidas de desempleo, nivel de educación de los padres, localidad del vecindario y similares lo que proporcionó el contexto en el que probar el impacto acumulativo de generaciones de racismo histórico en el rendimiento (véase una definición en el diccionario y más detalles, en la plataforma general, sobre rendimientos) de los estudiantes.

Los estudios a gran escala proporcionan resultados generalizables y son lo suficientemente amplios como para desglosarlos en poblaciones de subgrupos. Con las agrupaciones de subgrupos, esas ideas de justicia social de igualdad, equidad y tratamientos y aplicaciones diferenciales pueden medirse y probarse a lo largo del tiempo y entre contextos. Estos aspectos aumentan la validez externa de los análisis y reducen las críticas de los cínicos de que las diferencias observadas son subjetivas.

Indicaciones

En cambio, la abundancia de puntos de datos utilizados en los análisis cuantitativos en gran escala puede proporcionar una vía para que los investigadores dejen de lado sus nociones preconcebidas de cómo parecen funcionar las cosas y se centren en cambio directamente en las pautas de los datos históricos, estructurales, institucionales y organizativos. Con estos aspectos, la interpretación puede ser menos ridiculizada por ser propensa a la interpretación a los ojos del observador y en su lugar puede ser reverenciada como la lente 20/20 para ver claramente los patrones que subyacen en nuestros sistemas sociales.

Datos a gran escala para la justicia social en la educación

En el siglo XXI, los datos a gran escala sobre los estudiantes, los maestros, los líderes escolares y las organizaciones escolares impregnan la educación de los Estados Unidos. Abunda la retórica de la toma de decisiones basada en datos, pero los dirigentes escolares y los maestros se sienten poco preparados y carecen de tiempo para responder a las preguntas con los datos. Shepard analiza cómo la falta de una capacitación clara en el diseño y el cuestionamiento de investigaciones corre el riesgo de que se utilicen e interpreten erróneamente los datos cuando los usuarios de los datos no tienen la capacidad de evaluar críticamente la calidad de las medidas, por ejemplo, si las medidas coinciden con el núcleo conceptual de sus preguntas de investigación o si hubo errores en la recopilación, la entrada o la codificación de los datos, o la capacitación para poner a prueba los supuestos y los sesgos que sustentan los datos. Estos problemas existen en todos los datos y, por lo tanto, un uso indisciplinado de los datos puede convertirse en políticas perjudiciales para los niños, su aprendizaje y el ideal de educación democrática (Gummer et al., 2018). Penuel hace hincapié en que la “toma de decisiones basada en la evidencia” todavía tiene que tomar forma en nuestras organizaciones educativas y la falta de preguntas claras que hacer a los datos, los datos a gran escala se convierten en un ejercicio de reportar números sin sentido (Gummer et al., 2018). Así pues, el aprendizaje y la capacitación de los profesionales de la educación para formular preguntas sobre la justicia social pueden determinar el tipo de datos que se reúnan, definir los análisis que se han de realizar y elaborar políticas basadas en pruebas encaminadas a mejorar las injusticias en las oportunidades de aprendizaje de los niños.

Definición de las oportunidades educativas

Cuando se consideran los datos a gran escala para abordar la equidad e igualdad en la educación, las definiciones se vuelven fundamentales para identificar correctamente la forma de medir estos atributos. La equidad es el penúltimo objetivo en el que las oportunidades no se diferencian por el nacimiento o la capacidad, y la capacidad de alcanzar los objetivos no se relega a unos pocos privilegiados. Así pues, la equidad tiene dos partes: el acceso a las oportunidades (insumos de recursos) y los éxitos en el logro (productos de resultados). El acceso a las oportunidades tiene sus raíces en la igualdad. La igualdad requiere el inquilino básico de la igualdad de acceso, independientemente de la sociodemografía de los individuos. Esto puede tener insumos de la comunidad a factores de escolaridad.Entre las Líneas En el caso de la escolarización, que es el tema central de este capítulo, esto significa que “la desigualdad puede definirse en términos de las consecuencias de la escuela para los individuos” (Coleman, 1990, p. 25). Esencialmente, la equidad apunta a la meta de la justicia social, donde sería necesario que hubiera medidas correctivas para ajustar las desigualdades sociales históricas. La equidad no puede existir sin evaluar primero la desigualdad para considerar cómo ajustar adecuadamente los recursos.

Hay una gran cantidad de medidas de desigualdad que se pueden utilizar, desde el coeficiente (ratio) de Gini, la desviación media relativa, Theil, y el coeficiente (ratio) de variación al cuadrado. Estas medidas captan la cantidad de distribuciones proporcionales de los ocupantes en un espacio, como los estudiantes en las escuelas, condados o vecindarios, en comparación con la distribución general de la población. (Tal vez sea de interés más investigación sobre el concepto). Este tipo de medidas puede responder a preguntas como: ¿son los estudiantes suspendidos representativos de todos los estudiantes del distrito? En el caso de una tubería curricular donde hay múltiples espacios anidados de (1) estudiantes (1a) que asisten a escuelas con o (1b) sin acceso y si 1a, entonces (2) estudiantes que (2a) están matriculados en los cursos o (2b) no y si 2a, entonces (3) que (3a) toma los exámenes de los cursos o (3b) no y finalmente, si 3a, (4) que aprueba los exámenes. Así pues, una medida debe ser comparable a través de esta agrupación y concentración compuesta que se mueve de un espacio para definir el siguiente espacio en la tubería.

La mayoría de las medidas de desigualdad no pueden producir indicadores comparables de desigualdad a través de un denominador interdependiente y móvil (ya que hay una pérdida compuesta de estudiantes en cada etapa del espacio). El índice Herfindahl-Hirschman (HHI), utilizado principalmente por los economistas, puede hacerlo utilizando un enfoque comparable para medir la concentración del mercado (Taagepera & Lee Ray, 1977). El HHI asume que todas las empresas tienen una oportunidad 1:1 de entrar en el mercado (una empresa, una oportunidad). Conceptualmente, los grupos de estudiantes actúan como “empresas” que ocupan diferentes espacios del mercado de los planes de estudio. Dado que las escuelas tienen distribuciones variables de la población estudiantil, la fórmula necesita ajustar el supuesto 1:1.

Declaración de las colecciones de datos

Otra consideración importante al investigar la justicia social en la educación es el tipo de recopilación de datos: censo o muestra.

Informaciones

Los datos del censo recogen información de toda una población, mientras que los datos de la muestra se recogen de un subconjunto de la población. (Tal vez sea de interés más investigación sobre el concepto).

▷ Lo último (en 2026)
▷ Si te gustó este texto o correo, considera compartirlo con tus amigos. Si te lo reenviaron por correo, considera suscribirte a nuestras publicaciones por email de Derecho empresarialEmprenderDineroMarketing digital y SEO, Ensayos, PolíticasEcologíaCarrerasLiderazgoInversiones y startups, Ciencias socialesDerecho globalHumanidades, Startups, y Sectores económicos, para recibir ediciones futuras.
Informaciones

Los datos censales incluyen el universo de todos los casos de la población y, por lo tanto, no tienen ningún error en las estimaciones, mientras que las colecciones de datos de muestra incluyen una selección de datos que pueden transformarse matemáticamente para representar a toda la población con una tolerancia de error estimada (Knoke et al., 2002).Entre las Líneas En los Estados Unidos, el Censo decenal de los Estados Unidos hace preguntas a todos los hogares de los Estados Unidos, mientras que la Encuesta de población actual se realiza todos los meses para mantener el pulso sobre los cambios en los hogares de los Estados Unidos utilizando datos de una muestra de hogares. Para la educación de los EE.UU., el Núcleo Común de Datos del Centro Nacional de Estadísticas Educativas (NCES) y la Recopilación de Datos sobre Derechos Civiles (CRDC) del Departamento de Educación de los EE.UU. son dos ejemplos de conjuntos de datos del censo. Los conjuntos de datos denominados “estudio” o “encuesta” del NCES, como el Estudio Longitudinal de la Primera Infancia (ECLS) o los conjuntos de datos de las Encuestas sobre Delincuencia y Seguridad, utilizan datos de muestra.

El tipo de recopilación de datos a utilizar depende de la pregunta de investigación. (Tal vez sea de interés más investigación sobre el concepto). Si la idea central es discutir los patrones de la población general de estudiantes, profesores, escuelas, o similares, entonces los conjuntos de datos que usan muestras están bien. Una ventaja de los conjuntos de datos de muestra es que a menudo se hacen preguntas de encuesta más matizadas sobre temas concretos. Por ejemplo, la encuesta ECLS puede mostrar los altibajos de los estudiantes individuales a lo largo de sus años de educación, ya que sigue a los mismos estudiantes y hace las mismas preguntas a lo largo de muchos años de escolaridad. Con este tipo de conjunto de datos, se pueden probar a fondo preguntas como los patrones de crecimiento medio del aprendizaje a lo largo del tiempo, y se pueden estimar las preguntas sobre los impactos de las calificaciones o la disciplina de los maestros en el aprendizaje de los estudiantes.

Basado en la experiencia de varios autores, mis opiniones, perspectivas y recomendaciones se expresarán a continuación (o en otros lugares de esta plataforma, respecto a las características en 2026 o antes, y el futuro de esta cuestión):

Si la pregunta de investigación o de política busca comprender las diferencias entre los estudiantes, los maestros o los subgrupos escolares, la muestra o los datos del censo a menudo pueden funcionar.

Puntualización

Sin embargo, si los recuentos de los subgrupos son pequeños, los datos del censo son más fiables porque los datos del censo no son propensos al error de muestreo. Para ilustrar esta idea, imagina un mapa de todos los hogares con estudiantes en los EE.UU. Ahora imagina que se dibuja una muestra representativa de estudiantes por nivel de grado en todo el país. Si la idea es hacer preguntas sobre las diferencias en las oportunidades educativas entre niños y niñas, entonces este tipo de muestra sería suficiente, ya que las leyes de la estadística mostrarían la alta probabilidad de que una muestra aleatoria seleccionada tenga una representación casi igual de niños y niñas. Si los recuentos se desviaran un poco, se podrían aplicar pesos para inclinar la balanza y obtener la división 51/49 niña/niño que se encuentra en la población. (Tal vez sea de interés más investigación sobre el concepto). Los modelos también querrían ajustar la representación de los estudiantes transgéneros a medida que los niveles de grado fueran aumentando ya que, antes de la adolescencia, muy pocos estudiantes se identifican como transgéneros, pero en la adolescencia, alrededor del 0,7 por ciento de la población estudiantil se identifica como tal.

Si el objetivo de la investigación es comprender las diferencias en las oportunidades educativas entre los chicos y chicas transexuales, entonces los datos de una base de datos general basada en muestras del NCES no serían suficientes, ya que sería muy poco probable que se seleccionara siquiera un estudiante transexual de esa muestra de hogares seleccionados. Incluso si hubiera unos pocos estudiantes transexuales que fueran muestreados al azar, la información sobre unos pocos estudiantes transexuales sería susceptible de mucho error (es decir, un gran error de muestreo), ya que no se podría confiar en los datos de un puñado de estudiantes para representar las pautas generales del subgrupo de género transexual. Para reunir datos sobre este grupo de estudiantes, habría que diseñar un muestreo (véase más detalles) muy particular, o bien podrían utilizarse los datos del censo, ya que éste ya cuenta con el universo de todos los estudiantes en la base de datos (es decir, si hubiera una opción de identificación de género más que binaria en el cuestionario del censo).

📬Si este tipo de historias es justo lo que buscas, y quieres recibir actualizaciones y mucho contenido que no creemos encuentres en otro lugar, suscríbete a este substack. Es gratis, y puedes cancelar tu suscripción cuando quieras:

Qué piensas de este contenido? Estamos muy interesados en conocer tu opinión sobre este texto, para mejorar nuestras publicaciones. Por favor, comparte tus sugerencias en los comentarios. Revisaremos cada uno, y los tendremos en cuenta para ofrecer una mejor experiencia.

Todos los estudiantes representan su propia voz en los datos del censo, mientras que los datos de la muestra permiten que una selección de estudiantes represente la variación entre las voces no muestreadas. Dado el Teorema del Límite Central de las estadísticas, la variación muestreada suele ser bastante cercana a la necesaria para poner a prueba la mayoría de las preguntas de investigación. (Tal vez sea de interés más investigación sobre el concepto).

Puntualización

Sin embargo, el Teorema del Límite Central no es suficiente cuando sólo hay unas pocas voces para hablar dentro de un subgrupo.

Datos verificados por: Chris

Datos verificados por: Chris

Véase También

Educación, Métodos de Investigación en Educación, Justicia Social, Igualdad, Derechos Humanos, Trabajo Social,

▷ Esperamos que haya sido de utilidad. Si conoces a alguien que pueda estar interesado en este tema, por favor comparte con él/ella este contenido. Es la mejor forma de ayudar al Proyecto Lawi.
▷ Lee Gratis Nuestras Publicaciones
,Si este contenido te interesa, considera recibir gratis nuestras publicaciones por email de Derecho empresarial, Emprender, Dinero, Políticas, Ecología, Carreras, Liderazgo, Ciencias sociales, Derecho global, Marketing digital y SEO, Inversiones y startups, Ensayos, Humanidades, y Sectores económicos, en Substack.

1 comentario en «Conjuntos de Datos en Gran Escala»

  1. La representación equitativa de los grupos en el mercado produce un HHI = 0. Cuanto más alto es el valor, mayor es el monopolio de un grupo en el mercado. A diferencia de muchos índices de segregación tradicionales de Gini, Theil y otros que se limitan a análisis de dos grupos (blanco-no blanco, blanco-hispano), el HHI permite evaluar varios grupos juntos. Con el HHI, las siete diferentes identidades raciales y de grupos étnicos1 citadas en los datos pueden compararse como un todo en lugar de una serie de pares que, de otro modo, serían un conjunto de 21 pares de combinación para los análisis.

    Responder

Foro de la Comunidad: ¿Estás satisfecho con tu experiencia? Por favor, sugiere ideas para ampliar o mejorar el contenido, o cómo ha sido tu experiencia:

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

▷ Recibe gratis nuestras revistas de Derecho empresarial, Emprender, Carreras, Dinero, Políticas, Ecología, Liderazgo, Marketing digital, Startups, Ensayos, Ciencias sociales, Derecho global, Humanidades, y Sectores económicos, en Substack. Cancela cuando quieras.

Descubre más desde Plataforma de Derecho y Ciencias Sociales

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo