Neue Managed AI-Models

25 Februar, 2026

Vorstellung unserer neuen Managed AI Models.

Joshua Hartmann

Systems Engineer

Joshua hat im Sommer 2023 seine Ausbildung zum Fachinformatiker für Systemintegration bei den NETWAYS Web Services erfolgreich abgeschlossen. Heute ist er ein wichtiger Teil des Teams, das sich mit großer Hingabe um die Kundenbetreuung und die kontinuierliche Weiterentwicklung der SaaS-Apps kümmert. Neben seinem musikalischen Talent am Klavier hat Joshua eine Leidenschaft für Wintersport und findet auch Freude im Gaming. Doch am allerliebsten verbringt er seine Zeit mit seiner besseren Hälfte, denn sie ist für ihn das größte Glück.

von Joshua Hartmann | Feb. 25, 2026

AI Blog

Ab sofort laufen bei uns zwei der stärksten multilingualen Open-Source Retrieval-Modelle 2025/26 komplett gemanagt über unsere API. Dadurch werden die NWS Managed AI-Models um zwei wichtige Komponenten erweitert.

Jeder, der schon einmal mit Retrieval-Augmented Generation (RAG), semantischer Suche oder modernen KI-Anwendungen wie Chatbots und Wissensdatenbanken gearbeitet hat, ist wahrscheinlich auf Embedding-Modelle und Reranker gestoßen. Diese Modelle sind essenziell, um Texte in vektorisierte Darstellungen umzuwandeln, die Maschinen effizient vergleichen und relevante Informationen abrufen können.

Heute möchten wir dir zwei neue Managed AI-Models in unserem Portfolio vorstellen.

BAAI bge-m3 und bge-reranker-v2-m3 sind live!

BAAI/bge-m3 ist das zurzeit populärste multilinguale Embedding-Modell
BAAI/bge-reranker-v2-m3 bietet ein sehr starkes Preis-Leistungs-Verhältnis im Reranking

bge-m3: Das Schweizer Taschenmesser unter den Embeddings

Warum aktuell so viele davon begeistert sind:

Unterstützt über 100 Sprachen auf sehr hohem Niveau (inkl. Deutsch, Französisch, Spanisch, Arabisch, Chinesisch, Japanisch, …)
Kontextlänge bis 8192 Tokens, perfekt für lange Dokumente, Handbücher, Gesetzestexte, Research-Papers
Unterstützt Dense Retrieval, Multi-Vektor Retrieval und Sparse Retrieval

Typische Anwendungsfälle:

Semantische & hybride Suche
RAG jeder Größenordnung
Mehrsprachige Wissensdatenbanken

bge-reranker-v2-m3: Der Qualitäts-Booster für deine Top-k Ergebnisse

Ein guter Retriever allein reicht oft nicht mehr. Der Reranker sortiert deine Top 20 oder Top 50 Kandidaten noch einmal deutlich präziser und genau hier glänzt dieses Modell.

Warum ist das Modell so beliebt?

State-of-the-Art bei multilingualem Reranking
Deutlich präziser als bi-encoder allein
Schnelle Verarbeitung

Typische Anwendungsfälle:

Zweistufiges Retrieval
RAG-Qualität deutlich steigern
Frage-Antwort-Systeme, Support- & interne Suche

Integration einfach gemacht

Die Modelle sind OpenAI-kompatibel. Das heißt: Du kannst sie fast überall dort nutzen, wo du bereits Embeddings oder Reranking nutzt oder in Zukunft nutzen möchtest.

Bekannte Frameworks & Tools, die direkt funktionieren:

LangChain / LlamaIndex
Haystack
n8n
Open-WebUI
LM Studio

Quickstart mit NWS Managed AI-Models

Unsere neuesten Modelle kannst du in nur 3 Schritten in deine bestehenden KI-Workflows einbinden.

Schritt 1: API-URL konfigurieren

Die Base-URL für die API-Endpunkte beider Modelle ist https://api.ai.nws.netways.de. Die benötigten Slugs der beiden Modelle lauten dann:

Für Embedding: /v1/embeddings
Für Reranking: /rerank

Schritt 2: Model-ID angeben

Für die Kommunikation über die OpenAI-kompatible API-Endpunkte musst du neben der API-URL noch die ID des gewünschten Modells angeben. Diese lautet wie folgt:

Embeddings: BAAI/bge-m3
Reranking: BAAI/bge-reranker-v2-m3

Schritt 3: API-Key hinterlegen und loslegen!

Jetzt musst du nurnoch einen API-Key in MyNWS generieren, oder einen bestehenden Key konfigurieren. Schon kannst du unsere neuesten Managed KI-Modelle nutzen.

Mit bge-m3 und bge-reranker-v2-m3 hast du aktuell eines der stärksten, flexibelsten und gleichzeitig preiswertesten Open-Source-Retrieval-Stacks zur Hand, ohne dich um Modellhosting, Quantisierung oder GPU-Verfügbarkeit kümmern zu müssen.

Ob du gerade einen mehrsprachigen Chatbot, eine interne Suche oder ein richtig gutes RAG-System baust: diese Kombination liefert 2026 State-of-the-Art-Qualität mit überschaubarem Aufwand.

Viel Spaß beim ausprobieren!

Unser Portfolio

0 Kommentare

Einen Kommentar abschicken Antwort abbrechen

Wie hat Dir unser Artikel gefallen?

Lies mehr von Joshua Hartmann