Imagina leer un artículo sobre un tema que no dominas, solo para descubrir más tarde que fue completamente fabricado por una IA. Para abordar este problema, un investigador de la Universidad de Binghamton ha desarrollado un algoritmo de aprendizaje automático llamado xFakeSci, que puede detectar hasta el 94% de los artículos falsos, casi el doble de eficaz que otras soluciones existentes.
¿Cómo funciona xFakeSci? El experto, cuyo campo principal de investigación es la informática biomédica, se interesó en la autenticidad del conocimiento debido a su trabajo con publicaciones médicas, ensayos clínicos y la minería de recursos en línea. Durante la pandemia global, observó un incremento en la difusión de investigaciones falsas, lo que lo inspiró a desarrollar xFakeSci.
Para probar su algoritmo, se crearon 50 artículos falsos sobre temas médicos populares como el Alzheimer, el cáncer y la depresión, y se compararon con la misma cantidad de artículos reales, utilizando las mismas palabras clave que se emplean para extraer literatura de bases de datos médicas.
El algoritmo xFakeSci analiza dos características principales en la escritura de los artículos. Primero, la cantidad de bigramas, que son pares de palabras que aparecen frecuentemente juntas, como «cambio climático» o «ensayos clínicos». En los artículos falsos, el número de bigramas es notablemente menor, pero estos están altamente conectados a otros términos y conceptos en el texto. En cambio, en los artículos reales, los bigramas son más variados y menos conectados, reflejando una diversidad y complejidad que la IA aún no puede replicar.