¿Puede la IA realizar controles de seguridad con sacos de arena para sabotear a los usuarios? Sí, pero no muy bien, por ahora.
Las empresas de inteligencia artificial afirman contar con controles de seguridad sólidos que garantizan que los modelos no digan ni hagan cosas raras, ilegales o inseguras. Pero ¿y si los modelos fueran capaces de evadir esos controles y, por alguna...