Was ist eigentlich Apertus?

Damit Verwaltungen ihre Digitalisierung und KI souverän, sicher und unabhängig gestalten können.

Bedeutung

Der lateinische Name Apertus leitet sich vom Verb aperire ab, was «öffnen» bedeutet – sinngemäss also Offenheit und Transparenz. Die Marke steht für eine Schweizer generative KI, die anders als die US-Konkurrenten in ihrer gesamten Entwicklung offengelegt ist. Dies umfasst auch die Architektur, Gewichte und Trainingsdaten.

Ausgangslage

Die beliebten grossen Sprachmodelle (LLM) – meist von US-Firmen entwickelt – sind alles andere als offen und stehen im Verdacht, mit der hemmungslosen Nutzung von Trainingsdaten Urheberrechte zu verletzen. Sie sind auch sprachlich limitiert, indem sie in den Trainingsdaten englisches Material weit höher gewichten. Kurz: Aussenstehende können die Funktionsweise der KI nicht nachvollziehen. Das will die Schweizer Initiative hinter Apertus ändern.

Apertus umfasst viele Sprachen, die in LLMs bisher unterrepräsentiert waren, wie Schweizerdeutsch, Rätoromanisch und viele andere. Apertus dient als Baustein für Entwickler und Organisationen für künftige Anwendungen.

Geschichte

Apertus wurde im Rahmen der Swiss AI Initiative entwickelt, unter der Leitung von ETH und EPFL auf der Infrastruktur des Swiss National Supercomputing Centre (CSCS).

Die Swiss AI Initiative wurde im Herbst 2023 mit 10 Millionen GPU-Stunden auf dem Supercomputer Alps (CSCS) und einem Zuschuss von CHF 20 Millionen des ETH-Rats und strategischen Partnern gegründet. Die Initiative gilt als die weltweit grösste Open-Science-/Open-Source-Initiative für KI-Grundlagenmodelle und die erste Initiative des Swiss National AI Institute, einer Partnerschaft zwischen dem ETH AI Center und dem EPFL AI Center. Die Initiative profitiert zudem vom Fachwissen von über 800 Forschenden (darunter 70 auf KI spezialisierte Professorinnen und Professoren) aus mehr als 10 akademischen Institutionen in der ganzen Schweiz.

Apertus wurde am 2. September 2025 veröffentlicht.

Deep Dive

Die grosse Schwäche der beliebten KI-Modelle liegt in den Trainingsdaten. Englisch dominiert, regionale Varianten und Minderheitensprachen sind dünn vertreten. Dazu kommt, dass Sprachmodelle Text in kleine Bausteine zerlegen und daraus die nächste wahrscheinliche Fortsetzung berechnen. Das funktioniert gut bei häufigen Mustern, scheitert aber bei seltenen Wendungen, langen Satzklammern und Dialekt. Ein zweiter Bremser ist das begrenzte Kontextfenster: Bei längeren Texten verlieren sie Begriffe, Tonalität und Bezüge. Beispiel: Bei schweizerdeutschen Redewendungen liefert eine herkömmliche KI teils wörtliche, teils falsch verstandene oder unscharfe Antworten. Dazu kommen Sicherheitsfilter, die Formulierungen glätten und Antworten vereinheitlichen.

Apertus-Modelle werden ausschliesslich auf offen verfügbaren Daten vortrainiert, wobei nachträglich robots.txt-Ausschlüsse respektiert und nichtzulässige, toxische und personenbezogene Inhalte herausgefiltert werden. Die wörtliche Wiedergabe von Daten wird stark unterdrückt. Apertus-Modelle erweitern die mehrsprachige Abdeckung erheblich: Sie trainieren auf 15 Billionen Token aus über 1000 Sprachen. Rund 40 % der Vortrainingsdaten sind für nicht-englische Inhalte reserviert.

Das Projekt der ETH, der EPFL und des CSCS folgt den Vorgaben der Schweizer Gesetzgebung und den Transparenzvorschriften des EU AI Acts. Sämtliche wissenschaftlichen Erkenntnisse aus der Entwicklung werden veröffentlicht, einschliesslich Datenaufbereitungsskripten, Checkpoints, Evaluierungs-Suites und Trainingscode, was eine transparente Überprüfung und Erweiterung ermöglicht.

Wirkung

Apertus ist ein offenes Sprachmodell und kein Chatbot wie ChatGPT. Es handelt sich also um die technischen Bausteine für neue Anwendungen.

Apertus steht in zwei frei verfügbaren Modellgrössen bereit – mit 8 Milliarden sowie mit 70 Milliarden Parametern. Die nutzungsfreundliche Open-Source-Lizenz lässt einen Gebrauch in Bildung und Forschung ebenso zu wie breite gesellschaftliche und wirtschaftliche Anwendungen.

Bereits hat Apertus Erfolge erzielt: Das offene Foundation Model wird über verschiedene Cloud-Plattformen bereitgestellt (Swisscom AI Platform, Amazon AWS, Microsoft Azure, Infomaniak, Phoenix technologies, Exoscale etc.). Konkrete Anwendungsbeispiele sind publicai.co und das ZurichCityGPT (https://oss.zuericitygpt.ch), ein KI-System, das Fragen zur Stadt Zürich beantwortet.

Die Modelle wurden auf Hugging Face bis Ende 2025 über 1.8 Millionen Mal heruntergeladen. Nach Einschätzung der Forschenden ein «aussergewöhnlicher Wert für öffentlich trainierte Open-Weight-Modelle einer akademischen Institution». Bereits wird an Apertus 1.5 mit erweiterten Bildverständnis-Fähigkeiten gearbeitet. Zudem sollen künftig externe Tools angeschlossen werden können, um komplexere Aufgaben zu bewältigen. Apertus 2 wird zudem wesentlich grössere und effizientere Modelle nutzen.

Eines der Ziele der Swiss AI Initiative zeichnet sich am Horizont ab: Künstliche Intelligenz soll mit Apertus wie Strassen oder Glasfaserleitungen Teil der öffentlichen Infrastruktur werden.

Alle bisher erschienenen Buchstaben im digitalen ABC

Abraxas erklärt die wichtigsten Begriffe und Buzzwords der IT-Branche.

A
wie Artificial Intelligence

Artificial Intelligence; abgek. AI,
engl. für dt. künstliche Intelligenz, abgek. KI

Zum Artikel im digitalen ABC
A
wie Apertus

Apertus; Kunstname für die erste in der Schweiz entwickelte KI auf Basis eines vielsprachigen grossen Sprachmodells (LLM).

Zum Artikel im digitalen ABC
B
wie Big Data

Big Data (von englisch big = gross und data = Daten)

Zum Artikel im digitalen ABC
B
wie Bug Bounty

Bug-Bounty-Programm (engl. sinng. Kopfgeld-Programm für Programmierfehler)

Zum Artikel im digitalen ABC
C
wie Cloud

Cloud, w.

Zum Artikel im digitalen ABC
C
wie CERT

CERT, Akronym für engl. Computer Emergency Response Team

Zum Artikel im digitalen ABC
D
wie Digitale Schweiz

1. Digitale Schweiz, w. (die digitale Transformation der Schweiz betreffend)
2. Nebenbedeutung: Teil des Markenversprechens von Abraxas. «Für die digitale Schweiz. Mit Sicherheit»

Zum Artikel im digitalen ABC
D
wie DevOps

DevOps, Kofferwort für Development und Operations

Zum Artikel im digitalen ABC
E
wie E-ID

E-ID, w. (staatlich anerkannte, nationale elektronische Identität)

Zum Artikel im digitalen ABC
E
wie Entra ID

Entra ID, cloudbasierter Identitäts- und Zugriffsverwaltungsdienst von Microsoft; neue Bezeichnung für Azure AD.

Zum Artikel im digitalen ABC
F
wie Firewall

Firewall, w.
engl. für Brandmauer

Zum Artikel im digitalen ABC
F
wie Federated Machine Learning

Federated Machine Learning,
abgekürzt FML, engl. für föderiertes Lernen.

zum Artikel im digitalen ABC
G
wie Graphical User Interface

GUI, s. (Abk. für engl. Graphical User Interface)

Zum Artikel im digitalen ABC
G
wie GitOps

GitOps,
Kofferwort für Git (Versionskontrollsoftware) und Operations

zum Artikel im digitalen ABC
H
wie Hermes

Hermes, m.
1. Götterbote aus der griech. Mythologie, u. a. Gott des Handels, Begleiter der Toten in den Hades
2. frz. Familienunternehmen mit Sitz in Paris für Luxus-Modeartikel
3. Abk. für «Handbuch der Elektronischen Rechenzentren des Bundes, eine Methode zur Entwicklung von Systemen», offener Standard zur Führung und Abwicklung von IT-Systemen

Zum Artikel im digitalen ABC
H
wie Hybrid Cloud

Hybrid Cloud

IT-Architektur aus privater und öffentlicher Cloud.

Zum Artikel im digitalen ABC
I
wie IoT

IoT, s.
Abk. für engl. Internet of Things

Zum Artikel im digitalen ABC
I
wie IAM

IAM, s.
Abk. für engl. Identity and Access Management

Zum Artikel im digitalen ABC
J
wie Java

Java, s.
1. kleinste der Grossen Sundainseln (Indonesien)
2. systemunabhängige Programmiertechnologie, besonders für Anwendungen im Internet

Zum Artikel im digitalen ABC
J
wie JSON

JSON,
Abk. für «JavaScript Object Notation».

Zum Artikel im digitalen ABC
K
wie Kubernetes

Kubernetes, m.
1. Steuermann (altgriechisch)
2. Container-Orchestrierungssystem (Software)

Zum Artikel im digitalen ABC
K
wie Kritische Infrastruktur

kritische Infrastruktur, w.
Bezeichnung für besonders wichtige und systemrelevante Infrastrukturen, ohne die die Schweiz Krisen nur schwer überleben könnte.

Zum Artikel im digitalen ABC
L
wie Latenz

Latenz, f.
1. Vorhandensein einer noch nicht sichtbaren Sache
2. Zeit zwischen Reiz und Reaktion (Physiologie)
3. symptomfreie Zeit zwischen Ansteckung und Ausbruch einer Krankheit (Medizin)
4. Zeit zwischen Anfrage und Antwort (IT)

Zum Artikel im digitalen ABC
L
wie LLM
M
wie Malware

Malware, f.
Software, die in Computersysteme eindringen und dort Störungen oder Schäden verursachen kann

Zum Artikel im digitalen ABC
M
wie Managed Workplace

Managed Workplace, m.
engl. Begriff für IT-Dienstleistungen mit externer Betreuung, erbracht von einem Managed Service Provider.

Zum Artikel im digitalen ABC
N
wie No Code

No Code, engl. Begriff für eine bestimmte Art der Softwareentwicklung und des Programmierens.

zum Artikel im digitalen ABC
N
wie New Work

New Work, n. od. f.
engl. für Neue Arbeit
Gesamtheit der modernen und flexiblen Formen der Arbeit bzw. der Arbeitsorganisation

zum Artikel im digitalen ABC
O
wie Outsourcing

Outsourcing, n.
engl. für Auslagerung
Übergabe von Aufgaben und / oder Strukturen eines Unternehmens an externe Dienstleister

zum Artikel im digitalen ABC
O
wie Outsourcing
P
wie Proxy

Proxy, m.
engl. für Stellvertreter
ein Vermittler von Anfragen in Computernetzwerken

zum Artikel im digitalen ABC
P
wie Personendaten

Personendaten, w. pl.
Fachbegriff für Daten, die eindeutig einem Menschen zugeordnet werden können.

zum Artikel im digitalen ABC
Q
wie Quantencomputer

Quantencomputer, m.
Aus Qubits und Quantengattern aufgebauter Computer, der die Gesetze der Quantenmechanik ausnutzt.

zum Artikel im digitalen ABC
Q
wie Quantensicherheit

Quantensicherheit, w.
technischer Begriff für die nächste Sicherheitsstufe von klassischen IT-Infrastrukturen

zum Artikel im digitalen ABC
R
wie Redundanz

Redundanz, f.
Zusätzliche technische Ressourcen als Reserve (Technik)

zum Artikel im digitalen ABC
R
wie Ransomware

Ransomware, f.
Kofferwort aus Ransom («Lösegeld») und Software, Schadsoftware von Hackern zum Zwecke der Erpressung

zum Artikel im digitalen ABC
S
wie Software-as-a-Service

SaaS, (ohne Artikel)
Kurzwort für englisch Software-as-a-Service = Software als Dienstleistung

zum Artikel im digitalen ABC
S
wie Serverless Computing

engl. Begriff für ein Cloud-Computing-Modell zum Entwickeln und Betreiben von Software

zum Artikel im digitalen ABC
T
wie Transport Layer Security

TLS, m.,
Kurzwort für englisch Transport Layer Security (= Transportschicht-Sicherheit)

zum Artikel im digitalen ABC
T
wie Turing-Test

Turing-Test, m.,
Bezeichnung für einen von Alan Turing vorgeschlagenen Test zur Prüfung von KI-Systemen

zum Artikel im digitalen ABC
U
wie USV

USV, w.,
Abk. für Unterbrechungsfreie Stromversorgung

zum Artikel im digitalen ABC
V
wie VPN

VPN, n.,
Abk. für engl. virtual private network = virtuelles privates Netzwerk

zum Artikel im digitalen ABC
W
wie White-Hat-Hacker

White-Hat-Hacker, m.
Ein White-Hat-Hacker (Oder White Hat, engl. für Weisser Hut) ist ein ethischer Hacker für Computersicherheit.

zum Artikel im digitalen ABC
X
wie XSS (Cross-Site-Scripting)

XSS, s.
Abk. für engl. Cross-Site-Scripting; dieses webseitenübergreifendes Scripting ist eine Angriffsmethode von Cyberkriminellen.

zum Artikel im digitalen ABC
Y
wie Y2K

Y2K,
Numeronym für das Jahr-2000-Problem, engl. Year und 2K für 2 Kilo = 2000

zum Artikel im digitalen ABC
Z
wie z/OS

z/OS,
seit 2001 im Einsatz stehendes Betriebssystem für IBM-Grossrechner

zum Artikel im digitalen ABC

Über Bruno Habegger

Bruno Habegger ist Abraxas-Magazin-Autor und Senior Communication Manager. Er verfügt über eine langjährige Erfahrung im ICT- und Energie-Bereich als Journalist, Contentproduzent und Berater. Er war Präsident einer Regionalpartei und an seinem damaligen Wohnort acht Jahre Mitglied der Sicherheitskommission.