OpenAI nutzte Millionen von YouTube-Videos zur Schulung ihrer KI: Google ist sehr verärgert.

Die künstliche Intelligenz von OpenAI hat Millionen von YouTube-Videos genutzt, um trainiert zu werden. Diese Vorgehensweise hat zu großer Verärgerung bei Google geführt, da das Unternehmen bedenkt, dass die Verwendung dieser Videos möglicherweise gegen die Nutzungsbedingungen verstößt. OpenAI, eine gemeinnützige Organisation, die sich auf die Erforschung und Entwicklung von künstlicher Intelligenz konzentriert, hat mit dieser Kontroverse eine Debatte über den Umgang mit Daten und Ethik in der KI-Entwicklung entfacht. Die Frage nach der rechtmäßigen Nutzung von Inhalten aus dem Internet zur KI-Schulung wird immer relevanter in der heutigen technologischen Landschaft.

Google wirft OpenAI vor, YouTube-Videos zur Schulung ihrer KI zu verwenden

Google wirft OpenAI vor, YouTube-Videos zur Schulung ihrer KI zu verwenden

Google hat vergangene Woche OpenAI beschuldigt, Videos von YouTube zu nutzen, um Sora zu trainieren. Eine Untersuchung der Zeitung The New York Times deutet nun darauf hin, dass OpenAI auch über eine Million Stunden YouTube-Videos verwendet hat, um Whisper zu trainieren, ihre KI, die Audio in Text umwandelt. Die Enthüllung hat bei Google für Unmut gesorgt, da es sich nicht nur um ihre Daten handelt, sondern auch OpenAI ihr direktester Konkurrent im Bereich der künstlichen Intelligenz ist.

Laut dem Bericht von The New York Times haben die führenden KI-Unternehmen bereits alle öffentlich verfügbaren Daten sowie private Sammlungen verbraucht, um ihre KIs zu trainieren. OpenAI stand anscheinend 2021 ohne ausreichende Daten da und erwog daher, YouTube-Videos, Podcasts und Hörbücher zu nutzen, obwohl dies rechtlich in einer Grauzone lag. Schlussendlich entschieden sie sich dafür, rund eine Million Stunden YouTube-Videos zu verwenden, um Whisper zu trainieren und argumentierten mit dem Begriff des angemessenen Gebrauchs, da sie nur einen Bruchteil der Milliarden Stunden an Videomaterial auf YouTube nutzten.

Der Sprecher von Google, Matt Bryant, bestätigt, dass das Unternehmen unbestätigte Berichte über die Aktivitäten von OpenAI erhalten hat und betont, dass sowohl unsere robots.txt-Dateien als auch die Nutzungsbedingungen das Scraping oder den nicht autorisierten Download von YouTube-Inhalten verbieten.

Die Forschung der New York Times zeigt auch, dass Meta bereits seit einiger Zeit ohne ausreichende Daten dasteht und die Möglichkeit in Betracht zog, Bücher zu lizenzieren oder sogar einen großen Verlag zu erwerben. Experten zufolge werden die KI-Unternehmen bis 2028 vor dem Problem stehen, dass ihnen die Daten ausgehen, sei es öffentliche oder private. Eine mögliche Lösung besteht darin, synthetische Daten zu erstellen oder alternative Trainingsmodelle zu nutzen, die nicht so datenintensiv sind, jedoch hat dies bisher nicht funktioniert.

Die KI-Unternehmen befinden sich in einem rücksichtslosen Wettlauf, um sich auf einem Markt zu positionieren, der enorme Gewinne verspricht. Dabei schrecken sie nicht davor zurück, das Urheberrecht zu umgehen, um ihre KIs schneller als die Konkurrenz zu trainieren. Diese riskante Rivalität wirft Zweifel an der vermeintlichen Sicherheit von KIs auf, die möglicherweise eine Bedrohung darstellen könnten.

Martin Mayer

Ich bin Martin, ein leidenschaftlicher Experte für Computer und Technologie. Als Autor für die unabhängige Zeitung UB Computer bringe ich Ihnen die neuesten Nachrichten aus der Welt der Technik mit strengster Objektivität. Meine Beiträge sind fundiert und informativ, um Ihnen einen umfassenden Überblick über die aktuellen Entwicklungen in der Computerbranche zu bieten. Tauchen Sie mit mir in die spannende Welt der Technologie ein und bleiben Sie immer auf dem neuesten Stand.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Go up