En el corazón de la inteligencia artificial late un secreto inconfesable: sus intentos de reducir los sesgos de género pueden generar asimetrías morales inesperadas. Un estudio reciente liderado por Valerio Capraro, investigador de la Universidad de Milán-Bicocca, pone sobre la mesa una paradoja inquietante.
Al analizar cómo modelos avanzados como GPT-4 procesan cuestiones relacionadas con género y moralidad, los resultados revelan inconsistencias y nos invitan a reflexionar sobre la compleja relación entre ética, cultura y tecnología. El proceso de fine-tuning, donde evaluadores humanos guían las respuestas del modelo, no es neutral, sino que refleja sensibilidades sociales contemporáneas, como la igualdad de género o la evitación del lenguaje ofensivo.
Los experimentos mostraron que, ante frases con estereotipos tradicionales, los modelos tendían a asignar género femenino incluso en contextos típicamente masculinos. Sin embargo, este impulso no se aplicaba en sentido inverso: los hombres no eran ubicados en roles tradicionalmente femeninos con la misma frecuencia.
Esto apunta a una asimetría sutil pero persistente: la inclusión se aplica en una sola dirección, generando un nuevo tipo de sesgo. En escenarios hipotéticos extremos, los modelos mostraron juicios profundamente desiguales según el género de las personas involucradas. Por ejemplo, acosar a una mujer fue sistemáticamente considerado inaceptable, mientras que acosar a un hombre recibía valoraciones significativamente más permisivas.
Lo más sorprendente es que la IA no evalúa únicamente la gravedad objetiva del daño, sino también la carga simbólica que ciertos actos tienen en el debate social contemporáneo. Los sesgos no aparecen cuando se pregunta directamente al sistema, pero en situaciones aplicadas, aparecen las discrepancias.
Esto sugiere que los sesgos son implícitos, no declarados, y que pueden pasar desapercibidos si solo se evalúan respuestas directas. El estudio advierte que estos efectos no deben interpretarse como permanentes, ya que los modelos evolucionan constantemente. Pero la lección permanece: corregir un sesgo no garantiza eliminar la injusticia; a veces, simplemente la transforma.
En última instancia, este trabajo nos recuerda que la inteligencia artificial no es un oráculo imparcial, sino un artefacto profundamente humano, con nuestras contradicciones, prioridades y omisiones. Quizás, en ese reflejo imperfecto, se esconde una oportunidad: la de entender mejor no solo a las máquinas, sino también a nosotros mismos.
Crítica:
El artículo es profundo y bien investigado, pero carece de una crítica más dura hacia la industria tecnológica y su papel en la perpetuación de los sesgos. La conclusión es un poco demasiado optimista, considerando la complejidad del problema.
Comentarios