Neue Managed AI-Models

25 Februar, 2026

Joshua Hartmann
Joshua Hartmann
Systems Engineer

Joshua hat im Sommer 2023 seine Ausbildung zum Fachinformatiker für Systemintegration bei den NETWAYS Web Services erfolgreich abgeschlossen. Heute ist er ein wichtiger Teil des Teams, das sich mit großer Hingabe um die Kundenbetreuung und die kontinuierliche Weiterentwicklung der SaaS-Apps kümmert. Neben seinem musikalischen Talent am Klavier hat Joshua eine Leidenschaft für Wintersport und findet auch Freude im Gaming. Doch am allerliebsten verbringt er seine Zeit mit seiner besseren Hälfte, denn sie ist für ihn das größte Glück.

von | Feb. 25, 2026

AI Blog 

Ab sofort laufen bei uns zwei der stärksten multilingualen Open-Source Retrieval-Modelle 2025/26 komplett gemanagt über unsere API. Dadurch werden die NWS Managed AI-Models um zwei wichtige Komponenten erweitert.

Jeder, der schon einmal mit Retrieval-Augmented Generation (RAG), semantischer Suche oder modernen KI-Anwendungen wie Chatbots und Wissensdatenbanken gearbeitet hat, ist wahrscheinlich auf Embedding-Modelle und Reranker gestoßen. Diese Modelle sind essenziell, um Texte in vektorisierte Darstellungen umzuwandeln, die Maschinen effizient vergleichen und relevante Informationen abrufen können.

Heute möchten wir dir zwei neue Managed AI-Models in unserem Portfolio vorstellen.

BAAI bge-m3 und bge-reranker-v2-m3 sind live!

  • BAAI/bge-m3 ist das zurzeit populärste multilinguale Embedding-Modell
  • BAAI/bge-reranker-v2-m3 bietet ein sehr starkes Preis-Leistungs-Verhältnis im Reranking

bge-m3: Das Schweizer Taschenmesser unter den Embeddings

Warum aktuell so viele davon begeistert sind:

  • Unterstützt über 100 Sprachen auf sehr hohem Niveau (inkl. Deutsch, Französisch, Spanisch, Arabisch, Chinesisch, Japanisch, …)
  • Kontextlänge bis 8192 Tokens, perfekt für lange Dokumente, Handbücher, Gesetzestexte, Research-Papers
  • Unterstützt Dense Retrieval, Multi-Vektor Retrieval und Sparse Retrieval

Typische Anwendungsfälle:

  • Semantische & hybride Suche
  • RAG jeder Größenordnung
  • Mehrsprachige Wissensdatenbanken

bge-reranker-v2-m3: Der Qualitäts-Booster für deine Top-k Ergebnisse

Ein guter Retriever allein reicht oft nicht mehr. Der Reranker sortiert deine Top 20 oder Top 50 Kandidaten noch einmal deutlich präziser und genau hier glänzt dieses Modell.

Warum ist das Modell so beliebt?

  • State-of-the-Art bei multilingualem Reranking
  • Deutlich präziser als bi-encoder allein
  • Schnelle Verarbeitung

Typische Anwendungsfälle:

  • Zweistufiges Retrieval
  • RAG-Qualität deutlich steigern
  • Frage-Antwort-Systeme, Support- & interne Suche

Integration einfach gemacht

Die Modelle sind OpenAI-kompatibel. Das heißt: Du kannst sie fast überall dort nutzen, wo du bereits Embeddings oder Reranking nutzt oder in Zukunft nutzen möchtest.

Bekannte Frameworks & Tools, die direkt funktionieren:

  • LangChain / LlamaIndex
  • Haystack
  • n8n
  • Open-WebUI
  • LM Studio

Quickstart mit NWS Managed AI-Models

Unsere neuesten Modelle kannst du in nur 3 Schritten in deine bestehenden KI-Workflows einbinden.

Schritt 1: API-URL konfigurieren

Die Base-URL für die API-Endpunkte beider Modelle ist https://api.ai.nws.netways.de. Die benötigten Slugs der beiden Modelle lauten dann:

  • Für Embedding: /v1/embeddings
  • Für Reranking: /rerank

Schritt 2: Model-ID angeben

Für die Kommunikation über die OpenAI-kompatible API-Endpunkte musst du neben der API-URL noch die ID des gewünschten Modells angeben. Diese lautet wie folgt:

  • Embeddings: BAAI/bge-m3
  • Reranking: BAAI/bge-reranker-v2-m3

Schritt 3: API-Key hinterlegen und loslegen!

Jetzt musst du nurnoch einen API-Key in MyNWS generieren, oder einen bestehenden Key konfigurieren. Schon kannst du unsere neuesten Managed KI-Modelle nutzen.

Mit bge-m3 und bge-reranker-v2-m3 hast du aktuell eines der stärksten, flexibelsten und gleichzeitig preiswertesten Open-Source-Retrieval-Stacks zur Hand, ohne dich um Modellhosting, Quantisierung oder GPU-Verfügbarkeit kümmern zu müssen.

Ob du gerade einen mehrsprachigen Chatbot, eine interne Suche oder ein richtig gutes RAG-System baust: diese Kombination liefert 2026 State-of-the-Art-Qualität mit überschaubarem Aufwand.

Viel Spaß beim ausprobieren!

Unser Portfolio

0 Kommentare

Einen Kommentar abschicken

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Wie hat Dir unser Artikel gefallen?