OpenAI et Microsoft sont accusés d’avoir volé des données pour entraîner ChatGPT

Siméon Allegaert
| 3 min de lecture

Dans le cadre d’un nouveau recours collectif, OpenAI et Microsoft ont été désignés comme accusés pour leur utilisation présumée de techniques de “web scraping” afin d’obtenir des données prétendument privées pour l’entraînement de ChatGPT et d’autres modèles d’intelligence artificielle (IA) associés.

OpenAI et Microsoft accusés d’avoir volé des données pour entraîner ChatGPT

Pour rappel, le scraping est une pratique qui consiste à utiliser un robot automatisé, souvent appelé “crawler”, pour collecter des données sur l’internet. Cette dernière action en justice affirme qu’OpenAI et Microsoft se sont sciemment livrés à une activité de scraping considérée comme illégale.

L’action collective la plus récente a été déposée le mardi 5 septembre à San Francisco par un cabinet d’avocats représentant deux ingénieurs anonymes. Il est officiellement déclaré par l’intermédiaire d’un document enregistré auprès du tribunal des États-Unis pour le district nord de la Californie :

« Ce recours collectif découle de la conduite illégale et préjudiciable des accusés dans le développement, la commercialisation et l’exploitation de leurs produits d’intelligence artificielle, notamment ChatGPT-3.5, ChatGPT-4.0, Dall-E et Vall-E, qui utilisent des informations privées volées, y compris des informations personnelles identifiables, de centaines de millions d’utilisateurs d’Internet, parmi lesquels on retrouve des enfants de tous âges, sans leur consentement éclairé ou qu’ils en soient pleinement conscients. »

Il apparait comme particulièrement important de souligner la nature exceptionnelle de ce vol de données selon l’action collective. Cette dernière se poursuit en dénonçant le fait qu’OpenAI a redoublé de stratégie pour récolter secrètement des quantités massives de données personnelles sur Internet après sa restructuration en 2019

De potentielles réparations financières pour les personnes concernées ? 

Par ailleurs, il est également indiqué que sans ce vol d’informations privées et protégées par le droit d’auteur et appartenant à des personnes réelles, les produits d’intelligence artificielle concernés ne seraient pas en mesure de générer des milliards de dollars comme ils le font à la date de rédaction de cet article.

Selon le dossier, les plaignants demandent aux tribunaux de leur accorder des dommages et intérêts, ainsi qu’à tous les membres des classes proposées, et qui pourraient éventuellement inclure toute personne dont les informations auraient été récupérées de manière illégale. Ils demandent également aux tribunaux d’ordonner aux défendeurs de procéder à un reversement des bénéfices réalisés à la suite de l’extraction illégale présumée de données. En clair, il s’agit d’une forme de réparation de la part des géants de l’industrie de l’intelligence artificielle.

Le 28 juin, une autre action collective a été intentée contre OpenAI et Microsoft dans le même district judiciaire, avec des allégations presque identiques. On ne sait pas encore si le tribunal ou les défendeurs dans les affaires séparées envisageraient de combiner les poursuites.

Source : Cointelegraph