Ollama con TensorRT en Ubuntu

Recientemente he instalado Ollama para ejecutar un “ChatGPT” en local y que haga uso de mi RTX 3060 que tiene 12GB de RAM.

Detalles importantes de la instalación que no se indica en la guía de instalación de Linux:

1. Aquí se indica cómo hacer para que la web escuche en 0.0.0.0, aunque esta es mi configuración:

cat /etc/systemd/system/ollama.service.d/override.conf 

&#91;Service]
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_KEEP_ALIVE=15m"

2. Para instalar CUDA yo recomiendo la instalación “deb (network)” porque así podremos instalar después TensorRT demanera fácil desde paquete (Ubuntu 22.04).

3. Instalar el paquete de TensorRT que permite la ejecución usando los núcleos dedicados para IA. Esto es tan sencillo como ejecutar:

apt-get install tensorrt

Aunque pareza que tendría que ejecutarse en CUDA y con los núcleos Tensor de manera igual, no es así, hay diferencias. En unas pruebas mías sobre código, era la diferencia entre que la respuesta fuese correcta vs incorrecta.

Yo mucha idea no tengo, pero tengo la intuición de que podría estar relacionado con que los núcleos Tensor estén realizando cálculos en punto flotante internamente, vs aritmética entera de CUDA para el caso de los modelos Q8/Q6_K (cuantización en INT8/INT6) que uso.

Aquí las pruebas:

4. nvidia-smi es un comando interesante para ver las estadísticas de memoria y uso de la GPU.

Edit: Ahora el modelo llama3, que antes me había dado una respuesta correcta, me muestra una respuesta incorrecta. Me siento confundido. Tal vez este post no sirva de nada 🤷‍♀️ .

Ollama con TensorRT en Ubuntu

Trending Articles

Mi 530d no arranca, códigos de avería

Ley Memoria Histórica o Democrática 2022 – Matrimonios con españoles – Cuba...

Coronel de la Guardia Nacional asume dirección de Polibolívar

TELEVISOR KONKA 43 PULG TV5-43K2 - 850.00USD

Silent Hill 2: Revelation (2012) 720p BRRip Dual Español Latino-Inglés

Merluzas en Airfryer con sofrito de pimientos rojos

[Wii] Silent Hill Shattered Memories [NTSC][WBFS][ESPAÑOL][MEGA]

Gobernador de Anzoátegui decreta 14 de noviembre como feriado no laborable

The Cranberries – When You’re Gone-Pronunciación Letra Traducción

QUÉDATE, BUEN JESÚS. Autor: Luis Iruarrízaga

Matan a dos personas en colonia Reparto Lempira, San Pedro Sula

Profetas de la Ciencia Ficción (Serie) Castellano

Fallece en Mérida el empresario Alvaro Juanes Ancona

ACTIVIDAD: El primer milagro de Jesús (para los más chiquitos)

Elodia, ahora en Playboy

Reguetoneros y productores que perdieron la vida

Coche de sustitucion en BMW al pasar campaña EGR

CDG INTERROGA A ZETA SECUESTRADOR DE TAMPICO

Ayuda!!!! Notificacion de Demanda Coppel

"MI VIDA FUE SIGNADA POR LA TRISTEZA Y LA POBREZA"