He estado dando vueltas a un concepto que llamaría una "ontología de contexto", principalmente porque desearía tener un solo lugar donde pudiera ver de dónde proviene el contexto y en qué indicaciones se usan.
el contexto útil para que un LLM genere una respuesta o tome medidas puede incluir cosas como (1) objetivo de alto nivel, (2) tarea / área de enfoque actual, (3) información resumida de tareas pasadas relevantes, (4) aprendizajes de intentos anteriores, etc.
a medida que esperamos más de nuestros agentes (tareas más largas, proyectos más complicados, etc.), la memoria sin procesar rápidamente se vuelve pesada y ruidosa, lo que reduce la calidad de la salida de LLM. la mayoría de las aplicaciones de IA complejas tienen algún tipo de contexto resumido (supongo) y múltiples fuentes de contexto.
La idea aquí es definir una ontología para el contexto que almacena*, cómo estructurarla y qué recuperar para cada mensaje en su sistema.
* Por tienda, no necesariamente me refiero a la base de datos de la IA. En mi opinión, se siente más holístico considerar los datos almacenados en cualquier aplicación como parte de la memoria de la IA (por ejemplo, conexión API / MCP). tal vez esta ontología también debería especificar esto.
yendo un paso más allá, podría hacer de esto una ontología dinámica que una IA puede administrar y probar, luego colocarla en un entorno de RL para que los agentes mejoren la gestión del contexto (hipotéticamente)
No estoy seguro de si la estrategia de resumen debería ir aquí, pero tiene sentido a un alto nivel. más complicado ya que la mayoría de las personas resumen la información al ingerirla, por lo que tendría que volver a resumir las ingestas anteriores cada vez que la cambie (para probar los cambios y la superación personal), pero supongo que este problema persiste independientemente.
No creo que nada aquí sea particularmente nuevo. Solo pienso en voz alta mientras trato de crear un marco interno para mapear varias estrategias que he visto.