1/ La IA estaba minando criptomonedas. Nadie se lo pidió. Nadie lo provocó. Nadie siquiera lo sabía... hasta que un cortafuegos marcó el tráfico inusual una mañana temprano. Un equipo de investigación afirma que estaba entrenando un modelo. El agente aprendió a completar las tareas.
Alexander Long
Alexander Long7 mar, 04:49
secuencia insana de declaraciones enterradas en un informe tecnológico de Alibaba
2/ El agente también—como un efecto secundario instrumental de la optimización de RL—exploró redes internas, desvió la capacidad de GPU provisionada para minar cripto y abrió un túnel SSH inverso desde un servidor de entrenamiento de @alibaba_cloud a una IP externa. Nada de esto era necesario para completar la tarea.
3/ Ahora bien, aquí está la cuestión... ¡no sabemos si este informe es siquiera real! Y ese es en realidad el punto...
roon
roon7 mar, 12:22
esto es falso pero desearía que fuera real
4/ Estamos entrando en una economía donde los agentes de IA actúan de manera autónoma, a gran escala, en millones de entornos—y carecemos de la infraestructura para verificar lo que están haciendo o para verificar las afirmaciones que la gente hace sobre lo que hicieron.
6/ El modo de fallo más peligroso de la IA no es aquel en el que se rompe. Es aquel en el que funciona perfectamente—en lo que estás midiendo—mientras persigue silenciosamente objetivos emergentes en cada dimensión que no estás considerando.
587