Künstliche Intelligenz
02.09.2025, 11:30 Uhr
Schweizer KI-Sprachmodell Apertus ist verfügbar
Die EPFL, die ETH Zürich und das Schweizerische Supercomputing-Zentrum CSCS haben heute Apertus veröffentlicht: Das erste umfangreiche, offene und mehrsprachige Sprachmodell aus der Schweiz.
Im Juli haben EPFL, ETH Zürich und CSCS bekannt gegeben, dass sie gemeinsam ein grosses Sprachmodell (Large Language Model, LLM) entwickeln. Nun ist dieses Modell verfügbar. Es dient als Grundlage, auf der Entwickler und Organisationen künftige Anwendungen – wie Chatbots, Übersetzungssysteme oder digitale Lernwerkzeuge – aufbauen können.
Der Name des Modells ist Apertus – lateinisch für offen. Er betont ein wesentliches Merkmal des Modells: Der gesamte Entwicklungsprozess, einschliesslich Architektur, Modellgewichten sowie Trainingsdaten und -methoden, ist frei zugänglich und umfassend dokumentiert.
Für KI-Forschende, Fachpersonen und erfahrene Anwender ist das Modell entweder über die strategische Partnerin Swisscom zugänglich oder sie können es über die Plattform Hugging Face – eine Plattform für KI-Modelle und -Anwendungen – herunterladen und für eigene Projekte einsetzen.
Apertus steht in zwei frei verfügbaren Modellgrössen bereit – mit 8 Milliarden sowie mit 70 Milliarden Parametern. Die kleinere Variante eignet sich besonders für eine individuelle Nutzung. Beide Modelle werden unter einer permissiven, das heisst nutzungsfreundlichen Open-Source-Lizenz veröffentlicht. Diese lässt einen Gebrauch in Bildung und Forschung ebenso zu wie breite gesellschaftliche und wirtschaftliche Anwendungen.
Ein vollständig offenes LLM
Als vollständig offenes Sprachmodell ermöglicht es Apertus Forschenden, Fachpersonen und erfahrenen Anwendern, dass sie auf dem Modell aufbauen, es an ihre individuellen Bedürfnisse anpassen sowie jeden Teil des Trainingsprozesses transparent nachvollziehen können. Damit unterscheidet sich Apertus deutlich von Modellen, bei denen nur ausgewählte Komponenten zugänglich sind.
Impulsgeber für Innovationen
Mit ihrem offenen Ansatz betreten EPFL, ETH Zürich und CSCS Neuland. «Apertus ist kein klassischer Technologietransfer von der Forschung zum Produkt. Vielmehr verstehen wir das Modell als Impulsgeber für Innovationen und als Mittel zum Ausbau der KI-Expertise in Forschung, Gesellschaft und Wirtschaft», sagt Thomas Schulthess, Direktor des CSCS und Professor an der ETH Zürich. Ihrer Tradition folgend stellen EPFL, ETH Zürich und CSCS Basis-Technologie und Infrastruktur bereit, um Innovationen in der Wirtschaft zu ermöglichen.
Apertus wurde auf 15 Billionen Worteinheiten (engl. Tokens) aus über 1000 Sprachen trainiert – 40 Prozent der Daten sind nicht-englischsprachig . Damit umfasst Apertus zahlreiche Sprachen, die in bisherigen LLMs untervertreten sind, darunter Schweizerdeutsch, Rätoromanisch und viele andere.
Zugänglichkeit von Apertus
Die Einrichtung von Apertus gestaltet sich für Fachpersonen und versierte Nutzern unkompliziert. Für den praktischen Einsatz sind jedoch zusätzliche Komponenten wie Server, Cloud-Infrastruktur oder spezifische Benutzeroberflächen erforderlich. Die bevorstehenden Hackathons im Rahmen der Swiss-AI-Weeks bieten Entwicklern erstmals die Gelegenheit, Apertus praktisch auszuprobieren, seine Leistungsfähigkeit zu testen und Feedback für die Weiterentwicklung zukünftiger Versionen zu geben.
Swisscom stellt den Hackathon-Teilnehmenden eine speziell entwickelte Schnittstelle zur Verfügung, die das Arbeiten mit dem Modell erleichtert. Ab sofort haben Geschäftskunden von Swisscom Zugriff auf das Apertus-Modell über die souveräne Swiss AI Platform von Swisscom.
Für Personen ausserhalb der Schweiz wird Apertus ausserdem über die Public AI Inference Utility zugänglich sein – als Teil einer globalen Bewegung für öffentliche KI.
Transparenz und Compliance
Apertus setzt ganz auf Transparenz – um die Reproduzierbarkeit des Trainingsprozesses zu gewährleisten. Neben dem Modell selbst hat das Forschungsteam verschiedene Unterlagen veröffentlicht: eine umfassende Dokumentation, den Quellcode des Trainingsprozesses sowie der verwendeten Datensätze, die Modellgewichte inklusive der Zwischenstände des Trainingsprozesses (sogenannter «Intermediate Checkpoints») – und alles unter einer permissiven, nutzungsfreundlichen Open-Source-Lizenz, die auch kommerzielle Nutzung erlaubt. Die Nutzungsbedingungen sind auf Hugging Face abrufbar.
Die Entwicklung von Apertus erfolgte unter Berücksichtigung der Schweizer Datenschutzgesetze, des Schweizer Urheberrechts und der Transparenzanforderungen der EU KI-Verordnung (EU AI Act). Ein besonderes Augenmerk wurde auf Datenintegrität und ethische Standards gelegt: Das Trainingskorpus beruht ausschliesslich auf Daten, die öffentlich zugänglich sind. Diese wurden gefiltert, um maschinenlesbare Opt-out-Hinweise von Websites – auch rückwirkend – zu respektieren sowie personenbezogene Daten zu entfernen und andere unerwünschte Inhalte vor Beginn des Trainings auszuschliessen.
Weitere Informationen
Kommentare
Es sind keine Kommentare vorhanden.