NIM LLM Text | TokenRouter Docs

Overview

NIM provides packaged inference services around NVIDIA’s serving stack.

Text/JSON; structured decoding supported.

Standard controls with NVIDIA acceleration.

Add guardrails as needed; vendor guidance applies.

Depends on chosen base models.

First-class on-prem support.

Commercial; varies by SKU.

See YAML references.