En este artículo analizaremos la población estudiantil de la Universidad desde una perspectiva de género para intentar averiguar si hay diferencias significativas en ámbitos como la composición o el rendimiento.
El análisis lo haremos para la Universidad Autónoma de Madrid (UAM), utilizando para ello los datos abiertos que la UAM ha publicado en UniversiDATA .
Lo primero que debemos hacer es marcarnos el destino: ¿A dónde queremos llegar? ¿Qué tipo de preguntas queremos responder? En el caso que nos ocupa las preguntas son:
Es esencial, antes de plantear cualquier análisis de datos, conocer bien la estructura y semántica de los datasets que se van a utilizar.
En este caso, para llevar a cabo nuestro análisis utilizaremos los siguientes recursos, que nos proporcionan toda la información de base que necesitaremos para hacer nuestro análisis:
Dataset de Matrículas de la UAM (Curso 2018-19) : En este dataset disponemos de las matrículas llevadas a cabo por los estudiantes durante el curso 2018-19, donde podemos encontrar diversos datos que nos permitirán llevar a cabo los análisis: el género, la titulación, diversos datos relativos a créditos matriculados o superados, indicadores de si se ha obtenido o no la titulación ese curso, y calificaciones finales, entre otros. Podemos consultar la descripción detallada de este dataset en el diccionario de datos de la especificación “Núcleo Común” que propone UniversiDATA.
Dataset de Titulaciones de la UAM (Curso 2018-19) : En este dataset disponemos de todas las titulaciones ofertadas por la UAM, junto con el dato - entre otros - de la Rama a la que cada una pertenece, o el nº de créditos necesarios para superar la titulación. Podemos consultar en el diccionario de datos de la especificación “Núcleo Común” que propone UniversiDATA.
Dataset de Población por comunidades, edad (año a año), Españoles/Extranjeros, Sexo y Año publicado por el INE : De este dataset publicado por el Instituto Nacional de Estadística podemos obtener la población de la Comunidad Autónoma de Madrid en edad universitaria para el año 2018.
En este análisis hacemos uso de los siguientes recursos:
Os recordamos que tanto las representaciones gráficas como las tablas de datos son interactivas:
Tras informarnos de la estructura y semántica de los datasets, es necesario hacer un análisis exploratorio de los contenidos en los mismos, con el fin de conocer la realidad de los datos a los que nos enfrentamos, sobre todo para poder detectar posibles peculiaridades, consideraciones o errores que pudieran afectar a la calidad de los resultados de nuestro análisis. Salvo en datasets muy muy sencillos, lo habitual es que siempre haya peculiaridades que hay que tener en cuenta.
Es muy importante tener en cuenta que - para poder ser ofrecidos al máximo nivel de detalle - el dataset de matrículas está anonimizado, lo cual tiene ciertas implicaciones que hay que conocer para poder hacer un análisis correcto. En concreto, hay que consultar cual es el “diferencial de privacidad”, es decir, las posibles pérdidas que los datos hayan podido sufrir como consecuencia de los procesos de anonimizacion. Consultando la documentación, vemos que en nuestro caso:
Los conceptos que vamos a utilizar con fines clasificatorios (la titulacion y diversos atributos de la misma, y el género) son parte de las “variables pivote” del dataset, como se puede observar en la documentación, lo que significa que conservan su relación intacta con todas las demás variables del dataset. Ningún problema en este aspecto entonces.
Los datos que utilizaremos para hacer los cálculos relativos al rendimiento (créditos, indicador de haber obtenido la titulacion y nota final en el caso de grados y másteres, e indicador de haberse doctorado y calificación obtenida en el caso de doctorados) pertenecen a los mismos grupos de coherencia (grupos 12 y 14 respectivamente, como se puede observar en la documentación), lo que significa que guardan la coherencia entre sí y pertenecen al mismo individuo. Por tanto ningún problema en este aspecto tampoco.
El indicador de si el estudiante se ha titulado o no, y el dato del año de inicio en el estudio pertenecen a grupos de coherencia distintos (grupos 3 y 12 en el caso de grado y máster, y 3 y 14 en el caso de doctorados), como se puede observar en la documentación. Esto significa que - para un mismo registro - no se pueda asegurar que el año de inicio y el indicador de si se ha titulado o no pertenezcan al mismo estudiante, por lo que el dataset no permite calcular el tiempo transcurrido hasta la titulación, algo que, a priori, habríamos querido incluir en el análisis.
Como resultado de los procesos de anonimización, en 44 de las 34.830 matrículas se ha ocultado la titulación. Solo supone un 0,1% de los casos, por lo que podemos asumir que su impacto en los resultados es despreciable, aunque podría implicar que en los desgloses detallados por titulación no aparezca alguna titulación minoritaria o algún género minoritario en alguna titulación.
Impacto de los procesos de anonimización en nuestro estudio:
Es posible que en el desglose por titulaciones que se presenta en el apartado 3.1.2 no aparezca alguna titulación minoritaria por haberse ocultado como consecuencia de los procesos de anonimización.
Es posible que en alguna titulación con uno de los dos géneros muy minoritario, se haya ocultado ese género por completo.
A continuación llevaremos a cabo el análisis de los datos recogidos en los recursos presentados en el apartado anterior. Separaremos el análisis en dos secciones: primero analizaremos la composición de la población estudiantil, y después su rendimiento, en ambos casos desde una perspectiva de género.
Según los datos obtenidos, en el curso 2018-19 la UAM registro 34.830 matrículas en estudios oficiales de grado, máster y doctorado. En este apartado analizaremos cómo se distribuyen esas matrículas entre hombres y mujeres desde diversos puntos de vista.
¿Cuántos hombres y mujeres había matriculados en el curso 2018-19, y qué proporción representan? Veamos en la siguiente gráfica la distribución global por género de todas las matrículas:
Esta primera gráfica global nos permite enunciar nuestro primer hallazgo:
HALLAZGO 1:
En el curso 2018-19, la proporción de hombres y mujeres en la UAM es distinta, con un reparto porcentual aproximado de un 60/40 a favor de las mujeres. Esto supone aproximadamente una diferencia de 5 puntos porcentuales por encima del sistema universitario español en prevalencia femenina, como puede verse, por ejemplo, en el informe CYD 2018.
Cabe preguntarse si la distribución global de hombres/mujeres obtenida en el apartado anterior es uniforme o presenta diferencias en base a la titulación, el ciclo o la rama.
Veamos en la siguiente gráfica la distribución por ciclo:
Esta gráfica nos permite enunciar nuestro segundo hallazgo:
HALLAZGO 2:
En el curso 2018-19, la proporción global de 60/40 entre mujeres y hombres se da también de forma aproximada en Grado y Máster, pero no en Doctorado, donde - aunque sigue habiendo mayoría femenina - la proporción se reduce a un 55/45.
Cabe preguntarse si la proporción desigual entre hombres y mujeres en la UAM es simplemente un reflejo de la estructura de la población general, o si, por el contrario, indica realmente que la población masculina está infrarrepresentada en la Universidad. Para ello utilizaremos los datos del INE que nos permiten calcular la proporción de hombres y mujeres en edad universitaria (tradicionalmente de 18 a 24 años) en el año 2018 para la Comunidad de Madrid, y los compararemos con las mismas proporciones en la Universidad. El resultado lo podemos observar en el siguiente gráfico:
En todo el rango de edad analizado, existen notables diferencias entre la proporción de hombres y mujeres en la población general de la CAM en edad universitaria y la población estudiantil de la UAM, reflejando una prevalencia de mujeres respecto a hombres sistemática que no se da en la población general. En el caso más extremo (población de 18 años), los hombres tienen una representación en la UAM 14 puntos porcentuales por debajo de la que tienen en la población general.
Esto nos permite enunciar nuestro tercer hallazgo:
HALLAZGO 3: La prevalencia de mujeres en la población estudiantil de la UAM no se puede explicar atendiendo a la proporción ente hombres y mujeres en la población general de la CAM.
Históricamente, siempre ha habido claros sesgos de género en cuanto a la preferencia de estudios dependiendo de la rama del saber a la que pertenecen. Analicemos a continuación la distribución de matrículas por rama en la siguiente gráfica:
Esta gráfica nos muestra una gran variabilidad entre ramas, y nos permite enunciar nuestro cuarto hallazgo:
HALLAZGO 4:
Existen diferencias muy sustanciales en la proporción de hombres y mujeres entre todas las ramas. El caso más notable es el de la rama de “Ingeniería y Arquitectura”, que además es el único que rompe la tendencia general de prevalencia femenina al presentar una proporción 24/76 a favor de los hombres. Cabe reseñar que las proporciones obtenidas están totalmente alineadas con los datos generales de la población universitaria española, segun puede verse, por ejemplo, en el informe La Universidad en Cifras de la CRUE.
Descendamos a un mayor nivel de detalle y analicemos ahora la distribución por género en cada una de las titulaciones. Puesto que el número supera largamente el centenar entre grados, másteres y doctorados, mostraremos en gráficas de cajas la distribución de la variable “porcentaje de mujeres” por ciclo y rama:
Como podemos observar en la gráfica, también entre titulaciones del mismo ciclo y rama existe una gran variabilidad en la proporción de hombres/mujeres. Incluso en las ramas con mayor prevalencia de hombres o mujeres encontramos titulaciones que contradicen la distribución general de la rama a la que pertenecen.
Para bajar a un mayor nivel de detalle y poder investigar cuáles son esas titulaciones, podemos consultar la información detallada por titulación en la siguiente tabla interactiva (con las posibles salvedades recogidas en la “Consideración 1” expuesta en el apartado 2.1 ):
Usando los filtros y la ordenación por columnas podemos identificar rápidamente titulaciones que “violan” la prevalencia de género de la rama a la que pertenecen, por ejemplo:
El Grado en Ingeniería Química, con un 46% de prevalencia femenina, que duplica la proporción femenina general de una rama tradicionalmente masculina (Ingeniería y Arquitectura)
El Grado en Fisioterapia, con un 54% de hombres, más del doble de la proporción masculina asociada a una rama tradicionalmente femenina (Ciencias de la salud)
La conclusión general la recogemos en nuestro quinto hallazgo:
HALLAZGO 5:
Si bien la tendencia general de prevalencia masculina/femenina de cada rama tiende a cumplirse en las titulaciones que la componen, la proporción de hombres/mujeres en titulaciones de la misma rama no es uniforme, sino que presenta una notable variabilidad dependiendo de la titulación concreta.
Otra pregunta interesante respecto a posibles diferencias entre hombres y mujeres es la referente al nivel de dedicación. ¿Hay algún sesgo de género en la dedicación a tiempo completo o a tiempo parcial en la población estudiantil de la UAM? En la siguiente gráfica analizamos las proporciones:
Si bien los hombres presentan una proporción ligeramente mayor de dedicación a tiempo parcial, la diferencia es prácticamente despreciable. Esto nos permite enunciar el sexto hallazgo:
HALLAZGO 6:
No existe apenas diferencia entre el nivel de dedicación a los estudios entre hombres y mujeres.
En los siguientes apartados analizaremos diversas métricas asociadas al rendimiento.
La tasa de eficiencia se define como el nº total de créditos necesarios para superar una titulación entre el nº total de créditos matriculados al término de la misma. Una tasa de eficiencia del 100% significa que todos los créditos se han superado en la primera matrícula, mientras que tasas de eficiencia inferiores al 100% indican que una parte de los créditos han tenido que volver a ser matriculados para ser superados.
En la siguiente gráfica calculamos la tasa de eficiencia de todos los titulados de grado y máster en el curso 2018-19 (excluyendo aquellos que tengan créditos convalidados o transferidos, ya que desvirtuan el cálculo), y los comparamos por rama y género:
En general, la eficiencia es bastante similar, excepto en “Ciencias Sociales y Jurídicas”, donde ligeramente superior en el caso de las mujeres, y sobre todo en el caso de “Ingeniería y Arquitectura” - que llama especialmente la atención - lo que supone nuestro séptimo hallazgo:
HALLAZGO 7:
A pesar de que las mujeres son minoría en la rama de Ingeniería y Arquitectura (representando un 24% de las matrículas), su tasa de eficiencia es sensiblemente mejor que la de los hombres.
La tasa de rendimiento se define como el nº de créditos superados entre el nº de créditos matriculados. En la siguiente gráfica calculamos para toda la población estudiantil de grado y máster matriculada en el curso 2018-19 (en contraste con la tasa de eficiencia del punto anterior, que por definición sólo se puede calcular para los titulados) la tasa de rendimiento desde el inicio de los estudios. Veamos la comparación por rama y género:
En este caso, si bien no hay diferencias de gran entidad, en todas las ramas las mujeres presentan una distribución del rendimiento ligeramente mejor a la de los hombres, lo que supone nuestro octavo hallazgo:
HALLAZGO 8:
No hay grandes diferencias en el rendimiento, si bien las mujeres presentan, en todas las ramas, un rendimiento ligeramente superior a los hombres..
Las métricas anteriores tenían en cuenta la superación o no de las asignaturas, pero no la calidad de esa superación, es decir, la nota obtenida. Veamos la distribución de notas medias en la población estudiantil de Grado y Máster que se tituló en el curso 2018-19:
En este caso, no se observa ninguna superioridad global clara, aunque sí en el caso de las ramas de “Ciencias Sociales y Jurídicas” e “Ingeniería y Arquitectura”, ya que las notas finales de las mujeres son - en general - algo mejores que las de los hombres, al igual que ocurría con las tasas de rendimiento y eficiencia en estas dos ramas (ver gráficas anteriores).
¿Y qué ocurre en doctorado? Veamos en la siguiente gráfica las distribuciónes de calificaciones de tésis doctorales por género para los doctorados en el curso 2018-19:
Como se puede observar, las distribuciones son muy similares. La única diferencia mínimamente apreciable es que los hombres tienen una mayor proporción de notas intermedias (Notables) y las mujeres un mayor porcentaje de notas extremas, tanto por arriba como por abajo (Apto y Sobresaliente).
En este análisis hemos utilizado los datasets con información detallada de las matrículas de la UAM en el curso 2018-19 para calcular y analizar diversas métricas de composición y rendimiento desde un punto de vista de género.
No olvide que puede plantearnos cualquier duda, corrección, comentario, petición, etc. en los comentarios a continuación, para los cuales no es necesario registro previo
¡Gracias por su atención!