NVIDIA ChatRTX se actualiza: nuevos modelos LLM junto al reconocimiento de voz e imagen

NVIDIA ha anunciado una importante actualización de su chatbot ChatRTX. En esta nueva actualización se han añadido nuevos modelos de lenguaje grande (MLL), además de poder interactuar con documentos locales como notas de audio, imágenes y otros datos. Ahora bien, antes de que pierdas tu valioso tiempo, te adelantamos de que este chatbot únicamente funciona si tienes una GPU NVIDIA GeForce RTX 30 hacia delante con acceso a 8 GB de VRAM. El segundo requisito seguro que lo cumplas, que es tener también acceso a 16 GB de memoria RAM.

Para que tengas un contexto, estos requisitos tienen un motivo, y es que a diferencia de cualquier otro chatbot, este se ejecuta localmente en tu PC. Es decir, no requieres de una conexión a Internet. Es por ello también que NVIDIA ChatRTX ocupará 35 GB de espacio en tu unidad de almacenamiento. Y sí, es el precio a pagar por tener acceso a un chatbot sin conexión a Internet. Esto rápidamente se traduce rápidamente en un gran impacto en la privacidad y el control sobre los datos que analices.

Estas son las mejoras integradas en NVIDIA ChatRTX tras su actualización

Gracias a esta actualización, NVIDIA ChatRTX se presenta como una versión más pulida y completa. Hay actualizaciones significantes al nivel de LLM, incluyendo Mistral 7B INT4 y Llama 2 7B INT4. Adicionalmente, se añadió soporte para LLM adicionales, entre los que se encuentra Gemma, LLM (utilizado para la creación de Google Gemini) y ChatGLM3, el cual destaca por ser compatible con el inglés y chino.

Más allá de los LLM, la gran novedad es la capacidad de NVIDIA ChatRTX de reconocer imágenes en nuestro PC. Para ello incorpora CLIP (preentrenamiento de imagen-lenguaje contrastante) de OpenAI. CLIP es capaz de reconocer lo que ve en las imágenes. De esta forma, puedes interactuar con tu biblioteca de imágenes sin necesidad de metadatos.

Resto de características implementadas

NVIDIA ChatRTX imagenes

Adicionalmente, ChatRTX ya no solo acepta entradas de texto, ahora reconocerá que estás hablando con él y transcribirá la información. Para la entrada de voz se ha integrado el modelo NLI de conversión de voz a texto de Whisper. Evidentemente, la principal ventaja respecto a cualquier chatbot, es que el usuario puede cambiar entre los modelos de IA que le interese. Además de crear y entrenar su propio conjunto de datos basado en texto e imágenes disponible de manera local en su PC con simplemente apuntar a una carpeta con documentos (bloc de notas, Word, PDF, etc.) así como imágenes.

Por ahora, la característica aún no disponible en NVIDIA ChatRTX es la falta de capacidad de hacer un seguimiento a las preguntas. Esto es algo más difícil de implementar. Esto es debido a que cada modelo tiene que conectar cada nueva pregunta con la pregunta anterior y con la respuesta que ofreció a esta pregunta. También tiene el problema de que la interfaz basada en navegador web solo es compatible con Google Chrome y Microsoft Edge. Mozilla Firefox presenta errores. Según indican desde Techpowerup.

NVIDIA ChatRTX está disponible para su descarga en la web oficial de la compañía.