Schweizer Forscher entwickeln lokale KI Cluster Software
KI hat unser Leben auf vielfältige Weise revolutioniert. Doch diese beeindruckenden Fortschritte haben auch eine Schattenseite: den enormen Energieverbrauch und die Abhängigkeit von riesigen Datenzentren. Die Frage, die sich zunehmend stellt, lautet: Brauchen wir wirklich diese grossen Rechenzentren, um KI voranzubringen?
Datenzentren sind das Rückgrat moderner KI. Sie bieten die Rechenleistung und Speicherressourcen, die für das Training und den Betrieb von KI-Modellen erforderlich sind. Insbesondere Deep-Learning-Modelle, die grosse Mengen an Daten verarbeiten müssen, sind auf leistungsstarke Hardware wie GPUs (Graphics Processing Units) und TPUs (Tensor Processing Units) angewiesen. Diese Hardware wird in grossen Datenzentren untergebracht, die weltweit verteilt sind.
Doch die Abhängigkeit von diesen Infrastrukturen hat ihren Preis. Datenzentren verbrauchen enorme Mengen an Energie. Laut einer Studie der Internationalen Energieagentur (IEA) machten Datenzentren im Jahr 2020 etwa 1 % des weltweiten Stromverbrauchs aus – eine Zahl, die mit der zunehmenden Verbreitung von KI weiter steigen könnte.
Der hohe Energieverbrauch von Datenzentren ist nicht nur ein wirtschaftliches, sondern auch ein ökologisches Problem. Der Betrieb und die Kühlung der Server erfordern immense Ressourcen. Hinzu kommt der CO₂-Ausstoss, der durch die Nutzung fossiler Brennstoffe zur Stromerzeugung entsteht. In einer Zeit, in der Nachhaltigkeit und Klimaschutz im Fokus stehen, ist dies ein kritischer Punkt.
Ein weiterer Aspekt ist die geografische Konzentration von Datenzentren. Viele dieser Einrichtungen befinden sich in Regionen mit kühlerem Klima, um die Kühlungskosten zu minimieren. Dies führt jedoch zu einer ungleichen Verteilung der Ressourcen und kann in einigen Ländern zu einer Überlastung der Infrastruktur führen.
Die gute Nachricht ist, dass es Ansätze gibt, um die Abhängigkeit von grossen Datenzentren zu reduzieren. Eine Möglichkeit ist die Entwicklung effizienterer Algorithmen. Forscher arbeiten daran, KI-Modelle zu erstellen, die weniger Rechenleistung und Speicher benötigen. Diese sogenannten "grünen Algorithmen" könnten dazu beitragen, den Energieverbrauch erheblich zu senken.
Plug and Play: verteilte KI einfach gemacht
Nun haben EPFL-Forscher Gauthier Voron, Geovani Rizk und Rachid Guerraoui vom Distributed Computing Laboratory (DCL) an der School of Computer and Communication Sciences neue Software veröffentlicht, die es Nutzern ermöglicht, Open-Source-KI-Modelle herunterzuladen und lokal zu verwenden, ohne dass die Cloud Fragen beantworten oder Aufgaben erledigen muss.
Die neue Software, genannt Anyway System, koordiniert und kombiniert verteilte Maschinen in einem lokalen Netzwerk zu einem On-Premise-Cluster. Es verwendet robuste Selbststabilisierungstechniken, um die Nutzung der zugrundeliegenden lokalen Hardware zu optimieren, was der weit verbreiteten Annahme widerspricht, dass riesige Rechenzentren für den Einsatz von KI-Modellen notwendig sind.
Es kann in nur einer halben Stunde auf einem Netzwerk lokaler Maschinen installiert werden, ohne dass Daten das Netzwerk verlassen, was Privatsphäre und Souveränität garantiert. Ein sehr großes KI-Modell wie GPT-120B, das neueste und größte offene Modell von OpenAI, kann in wenigen Minuten auf Anyway Systems heruntergeladen und bereitgestellt werden, wobei nicht mehr als 4 Rechner mit jeweils einer Standard-GPU (jeweils etwa 2300 CHF kosten) benötigt werden, anstatt eines teuren spezialisierten Rack-Gehäuses (rund 100.000 CHF), das bisher als notwendig für ein KI-Modell galt.
Mit Blick nach vorne – deine eigene KI zu Hause
Anyway Systems wurde kürzlich als einer von sechs Erstförderern des Startup Launchpad AI Track ausgewählt – angetrieben von UBS, dem ersten Förderprogramm der Schweiz, das sich auf KI spezialisiert hat. Diese Projekte, ausgewählt aus über 50 Vorschlägen, erhalten Fördermittel und maßgeschneiderte Unterstützung, um ihren Weg vom Prototyp zur Marktreife zu beschleunigen.
Die Software hat die Prototypenphase überschritten und wird nun in Unternehmen und Verwaltungen in der gesamten Schweiz getestet, unter anderem bei der EPFL. Frühe Nutzer bewerten derzeit alle Kompromisse hinsichtlich Geschwindigkeit, Genauigkeit und Qualität.
Tanya Petersen