bn
briefi.news

Δ-mem promete más memoria para modelos de IA sin ampliar el contexto

MercadoTecnología
Diario Bitcoin·byCanuto
·
Image for article: Δ-mem promete más memoria para modelos de IA sin ampliar el contexto
Un nuevo trabajo académico propone δ-mem, un mecanismo de memoria en línea que busca mejorar la capacidad de recuerdo de los modelos de lenguaje grandes sin recurrir a ventanas de contexto cada vez más costosas. La propuesta apunta a asistentes de largo plazo y sistemas de agentes, dos áreas donde retener y reutilizar información histórica se ha vuelto clave. *** δ-mem añade una memoria asociativa compacta a una columna vertebral congelada de atención completa. Con un estado en línea de 8×8, el sistema mejoró hasta 1,10 veces frente a la base congelada. Las mayores ganancias aparecieron en benchmarks con alta...

Leer el artículo completo

Este artículo proviene de Diario Bitcoin. Haz clic abajo para leer la historia completa:

Leer Artículo Completo