Ab sofort laufen bei uns zwei der stärksten multilingualen Open-Source Retrieval-Modelle 2025/26 komplett gemanagt über unsere API. Dadurch werden die NWS Managed AI-Models um zwei wichtige Komponenten erweitert.
Jeder, der schon einmal mit Retrieval-Augmented Generation (RAG), semantischer Suche oder modernen KI-Anwendungen wie Chatbots und Wissensdatenbanken gearbeitet hat, ist wahrscheinlich auf Embedding-Modelle und Reranker gestoßen. Diese Modelle sind essenziell, um Texte in vektorisierte Darstellungen umzuwandeln, die Maschinen effizient vergleichen und relevante Informationen abrufen können.
Heute möchten wir dir zwei neue Managed AI-Models in unserem Portfolio vorstellen.
BAAI bge-m3 und bge-reranker-v2-m3 sind live!
- BAAI/bge-m3 ist das zurzeit populärste multilinguale Embedding-Modell
- BAAI/bge-reranker-v2-m3 bietet ein sehr starkes Preis-Leistungs-Verhältnis im Reranking
bge-m3: Das Schweizer Taschenmesser unter den Embeddings
Warum aktuell so viele davon begeistert sind:
- Unterstützt über 100 Sprachen auf sehr hohem Niveau (inkl. Deutsch, Französisch, Spanisch, Arabisch, Chinesisch, Japanisch, …)
- Kontextlänge bis 8192 Tokens, perfekt für lange Dokumente, Handbücher, Gesetzestexte, Research-Papers
- Unterstützt Dense Retrieval, Multi-Vektor Retrieval und Sparse Retrieval
Typische Anwendungsfälle:
- Semantische & hybride Suche
- RAG jeder Größenordnung
- Mehrsprachige Wissensdatenbanken
bge-reranker-v2-m3: Der Qualitäts-Booster für deine Top-k Ergebnisse
Ein guter Retriever allein reicht oft nicht mehr. Der Reranker sortiert deine Top 20 oder Top 50 Kandidaten noch einmal deutlich präziser und genau hier glänzt dieses Modell.
Warum ist das Modell so beliebt?
- State-of-the-Art bei multilingualem Reranking
- Deutlich präziser als bi-encoder allein
- Schnelle Verarbeitung
Typische Anwendungsfälle:
- Zweistufiges Retrieval
- RAG-Qualität deutlich steigern
- Frage-Antwort-Systeme, Support- & interne Suche
Integration einfach gemacht
Die Modelle sind OpenAI-kompatibel. Das heißt: Du kannst sie fast überall dort nutzen, wo du bereits Embeddings oder Reranking nutzt oder in Zukunft nutzen möchtest.
Bekannte Frameworks & Tools, die direkt funktionieren:
- LangChain / LlamaIndex
- Haystack
- n8n
- Open-WebUI
- LM Studio
Quickstart mit NWS Managed AI-Models
Unsere neuesten Modelle kannst du in nur 3 Schritten in deine bestehenden KI-Workflows einbinden.
Schritt 1: API-URL konfigurieren
Die Base-URL für die API-Endpunkte beider Modelle ist https://api.ai.nws.netways.de. Die benötigten Slugs der beiden Modelle lauten dann:
- Für Embedding:
/v1/embeddings - Für Reranking:
/rerank
Schritt 2: Model-ID angeben
Für die Kommunikation über die OpenAI-kompatible API-Endpunkte musst du neben der API-URL noch die ID des gewünschten Modells angeben. Diese lautet wie folgt:
- Embeddings:
BAAI/bge-m3 - Reranking:
BAAI/bge-reranker-v2-m3
Schritt 3: API-Key hinterlegen und loslegen!
Jetzt musst du nurnoch einen API-Key in MyNWS generieren, oder einen bestehenden Key konfigurieren. Schon kannst du unsere neuesten Managed KI-Modelle nutzen.
Mit bge-m3 und bge-reranker-v2-m3 hast du aktuell eines der stärksten, flexibelsten und gleichzeitig preiswertesten Open-Source-Retrieval-Stacks zur Hand, ohne dich um Modellhosting, Quantisierung oder GPU-Verfügbarkeit kümmern zu müssen.
Ob du gerade einen mehrsprachigen Chatbot, eine interne Suche oder ein richtig gutes RAG-System baust: diese Kombination liefert 2026 State-of-the-Art-Qualität mit überschaubarem Aufwand.
Viel Spaß beim ausprobieren!





0 Kommentare