Bedeutung
Der lateinische Name Apertus leitet sich vom Verb aperire ab, was «öffnen» bedeutet – sinngemäss also Offenheit und Transparenz. Die Marke steht für eine Schweizer generative KI, die anders als die US-Konkurrenten in ihrer gesamten Entwicklung offengelegt ist. Dies umfasst auch die Architektur, Gewichte und Trainingsdaten.
Ausgangslage
Die beliebten grossen Sprachmodelle (LLM) – meist von US-Firmen entwickelt – sind alles andere als offen und stehen im Verdacht, mit der hemmungslosen Nutzung von Trainingsdaten Urheberrechte zu verletzen. Sie sind auch sprachlich limitiert, indem sie in den Trainingsdaten englisches Material weit höher gewichten. Kurz: Aussenstehende können die Funktionsweise der KI nicht nachvollziehen. Das will die Schweizer Initiative hinter Apertus ändern.
Apertus umfasst viele Sprachen, die in LLMs bisher unterrepräsentiert waren, wie Schweizerdeutsch, Rätoromanisch und viele andere. Apertus dient als Baustein für Entwickler und Organisationen für künftige Anwendungen.
Geschichte
Apertus wurde im Rahmen der Swiss AI Initiative entwickelt, unter der Leitung von ETH und EPFL auf der Infrastruktur des Swiss National Supercomputing Centre (CSCS).
Die Swiss AI Initiative wurde im Herbst 2023 mit 10 Millionen GPU-Stunden auf dem Supercomputer Alps (CSCS) und einem Zuschuss von CHF 20 Millionen des ETH-Rats und strategischen Partnern gegründet. Die Initiative gilt als die weltweit grösste Open-Science-/Open-Source-Initiative für KI-Grundlagenmodelle und die erste Initiative des Swiss National AI Institute, einer Partnerschaft zwischen dem ETH AI Center und dem EPFL AI Center. Die Initiative profitiert zudem vom Fachwissen von über 800 Forschenden (darunter 70 auf KI spezialisierte Professorinnen und Professoren) aus mehr als 10 akademischen Institutionen in der ganzen Schweiz.
Apertus wurde am 2. September 2025 veröffentlicht.
Deep Dive
Die grosse Schwäche der beliebten KI-Modelle liegt in den Trainingsdaten. Englisch dominiert, regionale Varianten und Minderheitensprachen sind dünn vertreten. Dazu kommt, dass Sprachmodelle Text in kleine Bausteine zerlegen und daraus die nächste wahrscheinliche Fortsetzung berechnen. Das funktioniert gut bei häufigen Mustern, scheitert aber bei seltenen Wendungen, langen Satzklammern und Dialekt. Ein zweiter Bremser ist das begrenzte Kontextfenster: Bei längeren Texten verlieren sie Begriffe, Tonalität und Bezüge. Beispiel: Bei schweizerdeutschen Redewendungen liefert eine herkömmliche KI teils wörtliche, teils falsch verstandene oder unscharfe Antworten. Dazu kommen Sicherheitsfilter, die Formulierungen glätten und Antworten vereinheitlichen.
Apertus-Modelle werden ausschliesslich auf offen verfügbaren Daten vortrainiert, wobei nachträglich robots.txt-Ausschlüsse respektiert und nichtzulässige, toxische und personenbezogene Inhalte herausgefiltert werden. Die wörtliche Wiedergabe von Daten wird stark unterdrückt. Apertus-Modelle erweitern die mehrsprachige Abdeckung erheblich: Sie trainieren auf 15 Billionen Token aus über 1000 Sprachen. Rund 40 % der Vortrainingsdaten sind für nicht-englische Inhalte reserviert.
Das Projekt der ETH, der EPFL und des CSCS folgt den Vorgaben der Schweizer Gesetzgebung und den Transparenzvorschriften des EU AI Acts. Sämtliche wissenschaftlichen Erkenntnisse aus der Entwicklung werden veröffentlicht, einschliesslich Datenaufbereitungsskripten, Checkpoints, Evaluierungs-Suites und Trainingscode, was eine transparente Überprüfung und Erweiterung ermöglicht. Mehr dazu im Tech-Bericht der Entwickler.
Wirkung
Apertus ist ein offenes Sprachmodell und kein Chatbot wie ChatGPT. Es handelt sich also um die technischen Bausteine für neue Anwendungen.
Apertus steht in zwei frei verfügbaren Modellgrössen bereit – mit 8 Milliarden sowie mit 70 Milliarden Parametern. Die nutzungsfreundliche Open-Source-Lizenz lässt einen Gebrauch in Bildung und Forschung ebenso zu wie breite gesellschaftliche und wirtschaftliche Anwendungen.
Bereits hat Apertus Erfolge erzielt: Das offene Foundation Model wird über verschiedene Cloud-Plattformen bereitgestellt (Swisscom AI Platform, Amazon AWS, Microsoft Azure, Infomaniak, Phoenix technologies, Exoscale etc.). Konkrete Anwendungsbeispiele sind publicai.co und das ZurichCityGPT (https://oss.zuericitygpt.ch), ein KI-System, das Fragen zur Stadt Zürich beantwortet.
Die Modelle wurden auf Hugging Face bis Ende 2025 über 1.8 Millionen Mal heruntergeladen. Nach Einschätzung der Forschenden ein «aussergewöhnlicher Wert für öffentlich trainierte Open-Weight-Modelle einer akademischen Institution». Bereits wird an Apertus 1.5 mit erweiterten Bildverständnis-Fähigkeiten gearbeitet. Zudem sollen künftig externe Tools angeschlossen werden können, um komplexere Aufgaben zu bewältigen. Apertus 2 wird zudem wesentlich grössere und effizientere Modelle nutzen.
Eines der Ziele der Swiss AI Initiative zeichnet sich am Horizont ab: Künstliche Intelligenz soll mit Apertus wie Strassen oder Glasfaserleitungen Teil der öffentlichen Infrastruktur werden.
Alle bisher erschienenen Buchstaben im digitalen ABC
-
A
wie Artificial Intelligence
Artificial Intelligence; abgek. AI,
engl. für dt. künstliche Intelligenz, abgek. KI -
B
wie Big Data
Big Data (von englisch big = gross und data = Daten)
-
B
wie Bug Bounty
Bug-Bounty-Programm (engl. sinng. Kopfgeld-Programm für Programmierfehler)
-
C
wie Cloud
Cloud, w.
-
C
wie CERT
CERT, Akronym für engl. Computer Emergency Response Team
-
D
wie Digitale Schweiz
1. Digitale Schweiz, w. (die digitale Transformation der Schweiz betreffend)
2. Nebenbedeutung: Teil des Markenversprechens von Abraxas. «Für die digitale Schweiz. Mit Sicherheit» -
D
wie DevOps
DevOps, Kofferwort für Development und Operations
-
E
wie E-ID
E-ID, w. (staatlich anerkannte, nationale elektronische Identität)
-
E
wie Entra ID
Entra ID, cloudbasierter Identitäts- und Zugriffsverwaltungsdienst von Microsoft; neue Bezeichnung für Azure AD.
-
F
wie Firewall
Firewall, w.
engl. für Brandmauer -
F
wie Federated Machine Learning
Federated Machine Learning,
abgekürzt FML, engl. für föderiertes Lernen. -
G
wie Graphical User Interface
GUI, s. (Abk. für engl. Graphical User Interface)
-
G
wie GitOps
GitOps,
Kofferwort für Git (Versionskontrollsoftware) und Operations -
H
wie Hermes
Hermes, m.
1. Götterbote aus der griech. Mythologie, u. a. Gott des Handels, Begleiter der Toten in den Hades
2. frz. Familienunternehmen mit Sitz in Paris für Luxus-Modeartikel
3. Abk. für «Handbuch der Elektronischen Rechenzentren des Bundes, eine Methode zur Entwicklung von Systemen», offener Standard zur Führung und Abwicklung von IT-Systemen -
H
wie Hybrid Cloud
-
I
wie IoT
IoT, s.
Abk. für engl. Internet of Things -
I
wie IAM
IAM, s.
Abk. für engl. Identity and Access Management -
J
wie Java
Java, s.
1. kleinste der Grossen Sundainseln (Indonesien)
2. systemunabhängige Programmiertechnologie, besonders für Anwendungen im Internet -
J
wie JSON
JSON,
Abk. für «JavaScript Object Notation». -
K
wie Kubernetes
Kubernetes, m.
1. Steuermann (altgriechisch)
2. Container-Orchestrierungssystem (Software) -
K
wie Kritische Infrastruktur
kritische Infrastruktur, w.
Bezeichnung für besonders wichtige und systemrelevante Infrastrukturen, ohne die die Schweiz Krisen nur schwer überleben könnte. -
L
wie Latenz
Latenz, f.
1. Vorhandensein einer noch nicht sichtbaren Sache
2. Zeit zwischen Reiz und Reaktion (Physiologie)
3. symptomfreie Zeit zwischen Ansteckung und Ausbruch einer Krankheit (Medizin)
4. Zeit zwischen Anfrage und Antwort (IT) -
L
wie LLM
-
M
wie Malware
Malware, f.
Software, die in Computersysteme eindringen und dort Störungen oder Schäden verursachen kann -
M
wie Managed Workplace
Managed Workplace, m.
engl. Begriff für IT-Dienstleistungen mit externer Betreuung, erbracht von einem Managed Service Provider. -
N
wie No Code
No Code, engl. Begriff für eine bestimmte Art der Softwareentwicklung und des Programmierens.
-
N
wie New Work
New Work, n. od. f.
engl. für Neue Arbeit
Gesamtheit der modernen und flexiblen Formen der Arbeit bzw. der Arbeitsorganisation -
O
wie Outsourcing
Outsourcing, n.
engl. für Auslagerung
Übergabe von Aufgaben und / oder Strukturen eines Unternehmens an externe Dienstleister -
O
wie Outsourcing
-
P
wie Proxy
Proxy, m.
engl. für Stellvertreter
ein Vermittler von Anfragen in Computernetzwerken -
P
wie Personendaten
Personendaten, w. pl.
Fachbegriff für Daten, die eindeutig einem Menschen zugeordnet werden können. -
Q
wie Quantencomputer
Quantencomputer, m.
Aus Qubits und Quantengattern aufgebauter Computer, der die Gesetze der Quantenmechanik ausnutzt. -
Q
wie Quantensicherheit
Quantensicherheit, w.
technischer Begriff für die nächste Sicherheitsstufe von klassischen IT-Infrastrukturen -
R
wie Redundanz
Redundanz, f.
Zusätzliche technische Ressourcen als Reserve (Technik) -
S
wie Software-as-a-Service
SaaS, (ohne Artikel)
Kurzwort für englisch Software-as-a-Service = Software als Dienstleistung -
T
wie Transport Layer Security
TLS, m.,
Kurzwort für englisch Transport Layer Security (= Transportschicht-Sicherheit) -
U
wie USV
USV, w.,
Abk. für Unterbrechungsfreie Stromversorgung -
V
wie VPN
VPN, n.,
Abk. für engl. virtual private network = virtuelles privates Netzwerk -
W
wie White-Hat-Hacker
White-Hat-Hacker, m.
Ein White-Hat-Hacker (Oder White Hat, engl. für Weisser Hut) ist ein ethischer Hacker für Computersicherheit. -
X
wie XSS (Cross-Site-Scripting)
XSS, s.
Abk. für engl. Cross-Site-Scripting; dieses webseitenübergreifendes Scripting ist eine Angriffsmethode von Cyberkriminellen. -
Y
wie Y2K
Y2K,
Numeronym für das Jahr-2000-Problem, engl. Year und 2K für 2 Kilo = 2000 -
Z
wie z/OS
z/OS,
seit 2001 im Einsatz stehendes Betriebssystem für IBM-Grossrechner
Über Bruno Habegger
Bruno Habegger ist Abraxas-Magazin-Autor und Senior Communication Manager. Er verfügt über eine langjährige Erfahrung im ICT- und Energie-Bereich als Journalist, Contentproduzent und Berater. Er war Präsident einer Regionalpartei und an seinem damaligen Wohnort acht Jahre Mitglied der Sicherheitskommission.