21 de marzo de 2021

La paradoja de Simpson

La que sigue es una historia sobre el mal uso de la matemática. Una aventura peligrosa que terminó en un juicio por discriminación de género que –en rigor– cualquier matemático podría haber detectado y evitado, si es que hubiera formado parte del estudio jurídico que asesoró a la joven que se sintió damnificada.

Sucedió hace un poco más de 40 años. Para ser más precisos, fue en el año 1973 e involucró a la Universidad de California, en Berkeley. Allí es donde se encuentra ubicada una de las universidades más importantes del mundo y, sobre todo, uno de los departamentos de matemática más importantes del mundo.

Una joven estudiante intentó ingresar en la universidad, pero no pudo hacerlo. Es decir, no pudo superar lo que aquí sería equivalente a un examen de ingreso. Ella, seguramente asesorada por un grupo de abogados, creyó interpretar que en Berkeley, en ese momento, había una práctica –sutil por cierto– para discriminar hombres y mujeres, algo así como una segregación por género.

Como creían tener las pruebas suficientes, iniciaron un juicio que conmovió no sólo a la universidad propiamente dicha, sino a toda la comunidad local. No lo escribí aún, pero Berkeley es un barrio que queda a unos 20 kilómetros al nordeste de San Francisco, en California. Si hubiera sido en alguna facultad de un Estado en donde un caso de estas características podría ser más esperable (piense en Mississippi, Alabama, o incluso Texas), quizás habría tenido un impacto distinto, pero… ¿en San Francisco?

Lo que sigue entonces es una breve descripción del error que se cometió o que cometieron los abogados que representaron a la joven. Los datos parecían mostrar que personas del sexo masculino eran aceptadas para ingresar con un porcentaje mayor que las mujeres, o en todo caso, con un porcentaje mayor que el simple azar.

Voy a cambiar los datos originales para hacer los cálculos más sencillos, pero nada va a cambiar en términos conceptuales. Le pido que me siga, porque es un problema que aparece con mucha más frecuencia de la que uno cree, tanto que el error de interpretación que genera recibe un nombre: “La Paradoja de Simpson”.

En general, a una universidad la conforman distintas facultades en donde se estudian distintas disciplinas. Por ejemplo, la Universidad de Buenos Aires alberga, entre otras, a las facultades de Ciencias Exactas, Medicina, Arquitectura, Ingeniería, etcétera.

Para hacer las cuentas más fáciles, voy a suponer que en Berkeley había nada más que dos facultades, medicina y kinesiología, y voy a suponer que ese año se presentaron a rendir los exámenes de admisión 2.200 personas divididos por mitades: 1100 personas de cada sexo.

Luego de las pruebas pertinentes, ingresaron en total 930 hombres y 390 mujeres.

Si uno mira estos datos, la conclusión inmediata que saca es la siguiente:

930/1100 = 84,54% ingresantes hombres

vs.

390/1100 = 35,45% ingresantes mujeres

Si a uno le presentan estos números, parece que no hay mucho para discutir: salvo que haya algún argumento desconocido, parece un caso evidente de discriminación por sexo o favoritismo por género. Más aún: cuando uno revisa años anteriores, este caso se repetía en forma sistemática.

Es por eso que con estos datos, los letrados de la joven creyeron que tenían motivos suficientes para iniciar el juicio. Y lo hicieron. Ahora, acompáñeme a revisar con un poco más de cuidado los detalles que faltan.

Investiguemos primero la distribución por facultad. Es decir, qué proporción de hombres y de mujeres se inscribió, tanto en medicina como en kinesiología.

Una observación: no deje que los números la/lo confundan. Elegí a propósito números fáciles para poder seguir el ejemplo. En definitiva, no se trata de revisar el juicio, que está saldado hace 41 años, sino de entender dónde está la paradoja.

Sigo: de las 1.100 mujeres aspirantes en total, 1.000 hicieron la admisión en medicina y solamente 100 se anotaron en kinesiología.

La proporción se revirtió en el caso de los hombres: de los 1100 aspirantes-hombres que se presentaron en la universidad, 1.000 se inscribieron en kinesiología y solamente 100 en medicina.

O sea, exactamente al revés que las mujeres.

Ahora veamos si hubo discriminación por facultad. Es decir, supongo que no se le escapa a usted que –en general– los exámenes de ingreso a la facultad de medicina son más difíciles que los que ofrece kinesiología, o bien las vacantes que tiene cada una son ciertamente distintas. De una u otra forma, como el examen fue el mismo en cada facultad (para hombres y mujeres) es razonable investigar cómo le fue a cada grupo.

Por una cuestión de vacantes disponibles, el examen de ingreso a medicina siempre fue más difícil que el de ingreso a kinesiología pero, de todas formas, la prueba era la misma para hombres o mujeres. Ahora veamos cómo le fue a cada grupo.

En el caso de medicina, de las 1.000 mujeres que se presentaron ingresaron 300. O sea, el 30 por ciento.

Curiosamente, lo mismo sucedió con los hombres, sólo que se presentaron muchos menos a rendir la prueba. Sobre 100 hombres que la rindieron, aprobaron 30. O sea, se mantuvo el mismo porcentaje entre hombres y mujeres: ingresó el 30 por ciento.

Ahora exploremos lo que pasó en kinesiología. En esta facultad se presentaron 100 mujeres a rendir el examen y aprobaron 90, es decir el 90 por ciento.

Por otro lado, se presentaron muchísimos más hombres al examen, 1.000, y lo interesantísimo es que aprobaron 900, o sea, también el 90 por ciento.

¿Qué conclusión podemos sacar hasta acá?

En cada facultad, el número de hombres y de mujeres que se presentaron a rendir el examen fueron muy diferentes, pero el porcentaje que superó la prueba fue el mismo en cada caso: 30 por ciento en medicina –independientemente del sexo– y 90 por ciento en kinesiología, ¡también independientemente del sexo!

Es decir, evidentemente el sexo no tuvo ninguna relevancia en cada facultad. Sin embargo, cuando uno mira los totales, sobre una muestra de 1.100 hombres y el mismo número de mujeres, ¡ingresaron 930 hombres y 390 mujeres!

Justamente en eso consiste la paradoja. En realidad, no hubo ninguna discriminación. Solo que al agruparlos por sexo y no por facultad, aparece una inconsistencia que en la realidad no existe.

Fíjese en esta tabla que resume todo.










Estos números son muy claros ahora. Al mirar la última columna solamente, pareciera como que hay un evidente sesgo en favor de los hombres, pero al hacer la discriminación por facultad, se advierte que “tal” discriminación no existe.

¿Cómo se explica esta “aparente” paradoja? Es que al haber una diferencia tan grande entre los postulantes hombres y mujeres por facultad, eso termina distorsionando la muestra total.

Cuando uno está en el colegio, “sufre” cuando tiene que sumar fracciones. La tentación es sumar los numeradores entre sí, y lo mismo con los denominadores. Por ejemplo, sería mucho más fácil si

2/3 + 5/8 = 7/11

¡Pero eso no es cierto! No se pueden sumar los numeradores y los denominadores así como están. [1]

En el caso que nos ocupa, si usted mira el cuadro que figura en (*) uno podría creer que:

(30/100) + (900/1000) = 930/1100 (1)

y

(300/1000) + (90/100) = 390/1100 (2)

¡Pero ninguna de las dos igualdades es cierta!

De hecho, si usted se fija, los números que figuran en (1) (sobre el sector izquierdo), son los mismos que los que aparecen en (2), solamente que aparecen “disimulados”. Es que (30/100) = (300/1000) y por otro lado (900/1000) = (90/100). Si se pudieran sumar fracciones simplemente sumando los numeradores por un lado y los denominadores por el otro, entonces quizá no habría paradoja y sí habría discriminación, aunque, para qué ocuparse de algo que es falso, ¿no?

El tema es que el juicio cayó ni bien fue presentado y el prestigio de la universidad de Berkeley queda intacto. Eso sí, terminó siendo un bochorno.

Una reflexión final: así como propuse hace un tiempo la incorporación de matemáticos en los hospitales (o centros de salud) en donde se investiga la incidencia del uso de ciertas drogas y el análisis estadístico que requiere de especialistas en el área, ¿no habrá llegado el momento también de incorporar matemáticos a los estudios jurídicos? ¿O ya es de práctica común y a mí se me escapa? Ciertamente no consultaron a ninguno en el estudio de letrados que asesoró a la joven estudiante, en el famoso caso de segregación por sexo en la Universidad de Berkeley que nunca existió.

Por Adrián Paenza (matemático argentino). Vía "El cohete a la luna"

[1] Dicho en términos generales, no es cierto que
(a/b) + (c/d) = (a+c)/(b+d). En rigor, 2/3 + 5/8 = 31/24….pero eso es otra historia.

El nombre proviene de este artículo, escrito por otro matemático: Simpson, Edward H. (1951). «The Interpretation of Interaction in Contingency Tables». Journal of the Royal Statistical Society, Ser. B 13: 238-241.

Entradas relacionadas

No hay comentarios.:

Publicar un comentario