Erstellung des künftigen KI-Fahrplans, damit Inferenzaufgaben über Geräte, Netzwerke und Clouds hinweg nahtlos ausgeführt werden können

Cloudflare, Inc. (NYSE: NET), der Marktführer im Bereich Connectivity Cloud, gab heute seine Zusammenarbeit mit Microsoft bekannt, die das Ziel hat, dass Unternehmen auf einfachere Weise KI genau dort ausführen können, wo dies ihren Bedürfnissen am besten entspricht. Da Inferenzaufgaben immer mehr verteilt werden, wird diese Zusammenarbeit Unternehmen in die Lage versetzen, KI-Modelle nahtlos über ein Computing-Kontinuum hinweg einzusetzen, das sich über Geräte-, Netzwerk-Edge- und Cloud-Umgebungen erstreckt. Auf diese Weise werden die Vorteile von zentralisierten und von verteilten Computing-Modellen maximiert. Durch die Nutzung von ONNX Runtime über diese drei Ebenen hinweg können Cloudflare und Microsoft sicherstellen, dass KI-Modelle überall dort ausgeführt werden können, wo sich die Verarbeitung in dieser dreistufigen Architektur am sinnvollsten erweist von der Hyperscale-Cloud über den hyperverteilten Netzwerk-Edge bis hin zu den Geräten selbst und wo die Anforderungen an Bandbreite, Latenz, Konnektivität, Verarbeitung, Akku/Energie sowie an die Datenhoheit und -lokalisierung einer bestimmten Anwendung bzw. eines bestimmten Dienstes am besten erfüllt werden.

Für das Training von KI-Modellen ist es erforderlich, dass sich die erheblichen Rechen- und Speicherressourcen in unmittelbarer Nähe zueinander befinden. Daher stellen zentralisierte Cloud-Plattformen die beste Umgebung für die intensiven Berechnungen dar, die für das KI-Modell-Training erforderlich sind. Das Training wird weiterhin zentralisiert erfolgen, Inferenzaufgaben werden jedoch zunehmend an dezentraleren Orten ausgeführt, insbesondere auf den Geräten selbst und in Edge-Netzwerken. Ein Teil der Inferenzaufgaben (z. B. ein autonomes Fahrzeug, das beim Erkennen eines Fußgängers eine Bremsung durchführt) wird auf dem physischen Gerät ausgeführt, um eine möglichst geringe Latenzzeit zu bieten. Zur Umgehung von Gerätebeschränkungen wie Rechenleistung, Speicherplatz und Akkulaufzeit müssen jedoch immer mehr Aufgaben in Edge-Netzwerken ausgeführt werden. Edge-Netzwerke die sich in unmittelbarer geografischer Nähe zu den Endnutzern und Geräten befinden bieten ein optimales Gleichgewicht aus Rechenressourcen, Geschwindigkeit und Datenschutz. Einige Anwendungen müssen möglicherweise drei Ebenen dieses IT-Kontinuums durchlaufen. Dabei arbeiten Geräte-, Netzwerk-Edge- und Cloud-Umgebungen zusammen, um dem Endnutzer so die bestmögliche Erfahrung zu bieten.

"Cloudflare und Microsoft werden gemeinsam den Fahrplan für den KI-Verkehr und die KI-Aufgaben erstellen, um die KI-Inferenz auf die spezifischen Bedürfnisse und Anforderungen der einzelnen Unternehmen zuzuschneiden", so Matthew Prince, CEO und Mitbegründer von Cloudflare. "Unabhängig davon, ob für Sie Geschwindigkeit oder Genauigkeit wichtig sind, ob Sie Bandbreitenprobleme hinsichtlich Energie und Konnektivität meistern oder regionale Lokalisierungsanforderungen erfüllen müssen Cloudflare und Microsoft können Sie dabei unterstützen, den besten Ort für Ihre KI-Aufgaben zu finden."

"Da Unternehmen die Leistungsfähigkeit der generativen KI für ihre speziellen Bedürfnisse auf bestmögliche Weise nutzen möchten, ist die Möglichkeit, KI-Modelle überall auszuführen, von zentraler Bedeutung", so Rashmi Misra, General Manager für Data, AI Emerging Technologies bei Microsoft. "Das globale Netzwerk von Cloudflare in Kombination mit der Erfahrung von Microsoft beim Training und bei der Bereitstellung der weltweit innovativsten KI-Workloads über unsere Azure-Cloud ermöglicht Unternehmen den Zugang zu einem neuen Maximum an Flexibilität und Leistungsfähigkeit für KI-Inferenz."

Cloudflare und Microsoft werden gemeinsam daran arbeiten, dass Unternehmen auf einfachere Weise KI an dem Ort ausführen können, der für ihre Workloads am besten geeignet ist. Dies setzt zwei Dinge voraus:

Die ONNX-Runtime von Microsoft erstellt eine standardisierte Lösung, mit der dieselben Modelle unabhängig von der Umgebung eingesetzt werden können: auf dem Gerät (Windows, mobil oder im Browser), am verteilten Netzwerk-Edge (Cloudflare) oder in der zentralen Cloud-Plattform von Azure. Cloudflare stellt die Infrastruktur bereit, die für das Routing des Datenverkehrs zwischen den verschiedenen Umgebungen je nach Konnektivität, Latenz, Compliance und weiteren Anforderungen erforderlich ist.

Unternehmen möchten in der Lage sein, Inferenzaufgaben in diesem Kontinuum aus Geräten, Edge-Netzwerken und Clouds zu verschieben, je nachdem, welche Leistung, Kosten und regulatorischen Anforderungen sie erfüllen müssen. Die KI-Fähigkeiten und die Hyperscale-Cloud-Infrastruktur von Microsoft werden in Kombination mit dem hyperverteilten Edge-Netzwerk von Cloudflare Unternehmen in die Lage versetzen, die Innovationskraft und Effizienz über den gesamten KI-Lebenszyklus hinweg zu fördern. Unternehmen werden somit Folgendes erzielen können:

Den besten Ort für KI-Aufgaben finden: Setzen Sie KI-Inferenz dort ein, wo die Verarbeitung für das Erreichen der gewünschten Ergebnisse am sinnvollsten ist, und maximieren Sie auf diese Weise die Vorteile von zentralisierten und verteilten Rechenmodellen. Ein Sicherheitskamerasystem könnte beispielsweise Edge-Netzwerke für die Objekterkennung nutzen. Die Ressourcenbeschränkungen des Geräts selbst werden dabei überwunden, ohne Daten zur Verarbeitung an einen zentralen Server senden zu müssen.

Setzen Sie KI-Inferenz dort ein, wo die Verarbeitung für das Erreichen der gewünschten Ergebnisse am sinnvollsten ist, und maximieren Sie auf diese Weise die Vorteile von zentralisierten und verteilten Rechenmodellen. Ein Sicherheitskamerasystem könnte beispielsweise Edge-Netzwerke für die Objekterkennung nutzen. Die Ressourcenbeschränkungen des Geräts selbst werden dabei überwunden, ohne Daten zur Verarbeitung an einen zentralen Server senden zu müssen. Sich ändernde Anforderungen steuern: Führen Sie Modelle an allen drei Orten aus und passen Sie sie je nach Verfügbarkeit, Anwendungsfall und Latenzanforderungen an bzw. greifen Sie auf sie zurück.

Führen Sie Modelle an allen drei Orten aus und passen Sie sie je nach Verfügbarkeit, Anwendungsfall und Latenzanforderungen an bzw. greifen Sie auf sie zurück. Modelle auf Cloudflare mit wenigen Klicks bereitstellen: Greifen Sie über Microsoft Azure Machine Learning auf einfach einsetzbare Modelle und auf ML-Tooling-Funktionen von Workers AI zu.

