Die rasante Entwicklung von Künstlicher Intelligenz (KI) führt zu neuen Herausforderungen im Bereich Datenschutz und Urheberrechte. Unternehmen wie OpenAI und Google sind auf eine Vielzahl von Daten aus dem Internet angewiesen, um ihre KI-Modelle zu trainieren. Doch dabei werden oft Grauzonen ausgenutzt.
Im Jahr 2021 geriet OpenAI, das Unternehmen hinter GPT-4, an seine Grenzen, als ihnen die für das Training benötigten Daten knapp wurden. Um dieses Problem zu lösen, griff OpenAI auf mehr als eine Million Stunden Youtube-Videos zurück, wie die New York Times berichtet. Durch das Spracherkennungstool Whisper konnten sie diese Videos nutzen, um ihre Sprachmodelle wie ChatGPT zu verbessern.
Allerdings stoßen solche Praktiken auf rechtliche Bedenken, da die Nutzungsbedingungen von Youtube die Verarbeitung von Videos durch Dritte untersagen. Auch Google nutzte Texte aus Youtube-Videos, um seine KI-Modelle zu trainieren, was potenziell Urheberrechte verletzte.
Als Reaktion darauf hat Google seine Nutzungsbedingungen aktualisiert und beschränkt nun die Nutzung von Daten aus Youtube. Außerdem hat das Unternehmen Einverständniserklärungen von einigen größeren Youtube-Künstlern eingeholt.
Die zunehmende Nachfrage nach Daten für KI-Modelle könnte laut dem Forschungsinstitut Epoch bis 2026 zu Engpässen führen. Unternehmen verwenden Daten schneller, als sie produziert werden, was bereits zu Bedenken bezüglich der Verfügbarkeit neuer Daten führt. Es bleibt abzuwarten, wie Unternehmen und Regulierungsbehörden auf diese Herausforderungen reagieren werden, während die KI-Entwicklung weiter voranschreitet.