Zyphra lanza ZAYA1-8B, un modelo abierto que desafía a gigantes de IA con menos de 1B activo
Tecnología
Diario Bitcoin·byCanuto
·

Zyphra presentó ZAYA1-8B, un nuevo modelo abierto de razonamiento tipo MoE entrenado sobre infraestructura de AMD que, según la empresa, logra competir con sistemas mucho más grandes en matemáticas, código y tareas complejas gracias a una combinación de arquitectura, preentrenamiento orientado al razonamiento y un método de cómputo en tiempo de prueba llamado Markovian RSA. *** ZAYA1-8B usa menos de 1B de parámetros activos y, según Zyphra, supera a varios modelos abiertos de mayor tamaño en matemáticas y razonamiento. El modelo fue desarrollado sobre clústeres AMD MI300X con redes AMD Pensando Pollara, en colaboración previa con IBM Cloud y AMD....
Leer el artículo completo
Este artículo proviene de Diario Bitcoin. Haz clic abajo para leer la historia completa:
Leer Artículo Completo