Fin de l’anonymat ? Una IA de Anthropic puede identificarte por menos de 4 dólares
Durante mucho tiempo, el anonimato en Internet se basó en un principio tácito: tus huellas existen, pero nadie tiene tiempo para juntar las piezas. Una nueva prepublicación en arXiv, coescrita por investigadores de Anthropic y de ETH Zurich, sugiere que esta «oscuridad práctica» está comenzando a desmoronarse, no porque los datos sean nuevos, sino porque los LLM automatizan la investigación.
Lo que muestra el documento (sin sensacionalismo)
El trabajo, titulado Desanonimización a gran escala en línea con LLMs, describe un pipeline de agente IA capaz de vincular perfiles seudónimos a identidades reales a gran escala, únicamente a partir de texto público e indicios indirectos (intereses, estilo, detalles biográficos dispersos), confrontando luego estas señales con candidatos encontrados en línea.
Los autores evalúan el método en tres conjuntos de datos con «verdad en el terreno» (donde la identidad real es conocida, para evitar dirigirse a anónimos «reales» sin consentimiento):
- asociación Hacker News → LinkedIn después de eliminar los identificadores evidentes,
- vinculación de cuentas de Reddit a través de comunidades,
- división artificial del historial de un usuario de Reddit en dos perfiles, para probar la capacidad de entender que se trata de la misma persona.
Resultados que cambian la escala de riesgo
El documento informa que el enfoque basado en LLM supera ampliamente a los métodos «clásicos»: hasta un 68% de recuperación y aproximadamente un 90% de precisión según los conjuntos de datos, mientras que las líneas de base no LLM caen cerca de cero en estas configuraciones.
Otro dato notable: el costo estimado de una identificación en su pipeline experimental sería de entre 1 y 4 dólares por perfil, lo que teóricamente hace posible campañas a gran escala (y, por ende, el riesgo de abusos).
Por qué esto es importante para «todos», no solo para celebridades
La seudonimidad sirve como un cinturón de seguridad para usos ordinarios (salud, sexualidad, trabajo, deudas, opiniones) pero también para categorías expuestas (periodistas, activistas, denunciantes). El estudio sugiere que la llegada de agentes IA capaces de «investigar» reduce la barrera: lo que antes requería horas humanas puede convertirse en una rutina automatizada.
Los autores también aclaran dos salvaguardas: se trata de una prepublicación no revisada por pares y han retenido ciertos detalles técnicos para reducir el potencial de mal uso, mostrando así que son conscientes de la naturaleza de doble uso.
La privacidad no está «muerta», pero el modelo mental debe cambiar
Esta investigación no significa que todo intento de anonimato esté destinado al fracaso. Significa más bien que la antigua intuición — «mis publicaciones están sumergidas en la multitud» — es menos válida, porque la IA sabe buscar, comparar y razonar a una velocidad y escala sin precedentes. El cambio es significativo: la defensa ya no puede basarse únicamente en el volumen de ruido. Debe centrarse en la disciplina de la señal.
Sin entrar en técnicas «operativas», algunos principios surgen mecánicamente del tipo de señales explotadas: evitar diseminar detalles biográficos únicos (trayectorias, empleador, lugares, horarios, anécdotas muy específicas) bajo el mismo seudónimo, limitar los cruces involuntarios entre cuentas (mismas formulaciones, mismos «rituales» de publicación, mismas referencias personales), aislar los usos sensibles (seudónimos separados, higiene de perfiles) y, sobre todo: tratar la seudonimidad como un nivel de protección, no como una garantía.
¿Y ahora qué?
A corto plazo, este estudio ejerce presión sobre dos actores: las plataformas, que deberán proteger mejor a los usuarios contra la correlación intersitios (y limitar mejor la exfiltración masiva de contenidos públicos), y los proveedores de IA, que deberán gestionar un paradoja: mejorar las capacidades de búsqueda y razonamiento… mientras limitan su mal uso.
El punto más incómodo es también el más lúcido: la IA hace que ciertos tipos de investigación sean «más baratos». La pregunta se convierte así en política, producto y legal: ¿quién puede hacerlo, con qué límites y con qué salvaguardias?




