Una nueva herramienta analiza y aborda las disparidades culturales en las distintas versiones lingüísticas, allanando el camino para una información más equilibrada.
Los sesgos culturales y sociales influyen significativamente en el contenido multilingüe de Wikipedia, según un equipo de investigadores que incluye a un científico informático de la Universidad Johns Hopkins.
Al crear e implementar una nueva herramienta llamada INFOGAP, los investigadores utilizaron inteligencia artificial para observar cómo se presenta la información biográfica sobre las personas LGBT en las versiones en inglés, ruso y francés de Wikipedia y encontraron inconsistencias en cómo se las retrata.
Puntos clave
- La inteligencia artificial ayudó a los investigadores a encontrar inconsistencias en cómo se retrata a las personas LGBT en las versiones en inglés, ruso y francés de Wikipedia.
- Las disparidades muestran cómo las actitudes culturales pueden influir en la información y resaltan la necesidad de herramientas para identificar y abordar los sesgos para un intercambio de conocimientos más equitativo.
Las disparidades muestran cuán profundamente las actitudes culturales pueden influir en la información, lo que enfatiza la necesidad de herramientas y estrategias para identificar y abordar los sesgos para un intercambio de conocimientos más equitativo, dijo la miembro del equipo de estudio Anjalie Field , profesora asistente en el Departamento de Ciencias de la Computación de la Escuela de Ingeniería Whiting , y afiliada a su Centro de Procesamiento del Lenguaje y el Habla .
«Nuestra herramienta muestra cómo se puede utilizar la tecnología para estudiar los sesgos culturales a gran escala», dijo Field. «Más allá de Wikipedia, puede ayudar a analizar cómo diferentes regiones o idiomas presentan los mismos temas en las noticias u otros medios. Creemos que los educadores y los responsables de las políticas también podrían utilizarla para identificar y abordar los sesgos en recursos de uso generalizado, promoviendo una información más equilibrada».
El equipo presentó sus resultados en la Conferencia 2024 sobre Métodos Empíricos en Procesamiento del Lenguaje Natural celebrada en noviembre en Miami.»Nuestra herramienta muestra cómo se puede utilizar la tecnología para estudiar los sesgos culturales a gran escala».Campo AnjalieProfesor asistente, Departamento de Ciencias de la Computación
INFOGAP fue creado para analizar y comparar grandes cantidades de texto en diferentes idiomas de manera detallada y precisa, identificando lagunas y desequilibrios fácticos y arrojando luz sobre las influencias culturales, sociales y políticas.
«Muchos de los métodos existentes para estudiar las diferencias entre idiomas se basan en medidas simples como la longitud del texto o el tono general, que no proporcionan suficientes detalles para identificar lagunas o inconsistencias específicas», dijo Field. «INFOGAP resuelve este problema al comparar datos del mismo artículo escrito en diferentes idiomas y verificar que la información sea coherente. Este proceso permite examinar y medir cuidadosamente las diferencias en cómo se presentan los datos y el tono utilizado en los distintos idiomas, incluso cuando se trabaja con grandes cantidades de datos».
La herramienta demostró sus capacidades utilizando LGBTBIOCORPUS, una colección de más de 2.700 biografías de figuras públicas LGBT y no LGBT de Wikipedia en inglés, ruso y francés. El análisis reveló que las biografías de Wikipedia en ruso omitían el 77% del contenido presente en las versiones en inglés. Además, las entradas sobre personas LGBT no solo omitían más contenido, sino que también enfatizaban aspectos negativos en una mayor proporción. En promedio, el 50,87% de los datos negativos sobre personas LGBT en Wikipedia en ruso coincidían con sus contrapartes en inglés, en comparación con el 38,53% de las biografías no LGBT, lo que sugiere un sesgo significativo.
Field dice que este enfoque en los detalles negativos resalta cómo las actitudes y los prejuicios culturales influyen en el contenido en diferentes idiomas.
«Al medir estas diferencias, INFOGAP ofrece evidencia clara de sesgo sistémico, apoyando hallazgos previos de que el contenido ruso a menudo retrata los temas LGBT de manera más negativa que las versiones en inglés o francés», dijo.
El equipo señala que INFOGAP no se limita a identificar diferencias, sino que también ofrece soluciones al señalar datos o secciones faltantes en distintos idiomas, lo que ofrece a los editores una hoja de ruta clara para las actualizaciones. Por ejemplo, puede señalar cuándo faltan detalles positivos sobre una figura LGBT en la Wikipedia en ruso o en francés, lo que permite abordar esas lagunas. Además, los investigadores destacan su versatilidad, señalando que puede analizar variaciones en los medios, debates políticos y narrativas culturales más allá de Wikipedia.
Los coautores del artículo incluyen a Farhan Samir y Vered Shwartz de la Universidad de Columbia Británica; y Chan Young Park y Yulia Tsvetkov de la Universidad de Washington. Universidad Johns Hopkins News. D. L. Traducido al español