Mettons fin au suspense : la réponse à cette question n’est pas tout à fait tranchée, mais penche probablement vers le « oui » : sur du code basique, toutefois. Selon le média Semafor, OpenAI serait en train de signer des contrats en masse avec des développeurs. Les domaines ciblés indiquent clairement qu’il s’agit de tâches uniquement destinées à nourrir des IA capables de fournir du code sur une simple requête écrite.
Sam Altman, le directeur d’Open AI, se vantait récemment sur Twitter d’avoir relativement peu d’employés pour abattre le travail mené sur le développement d’intelligences artificielles. Et il est vrai que ceux-ci n’ont pas chômé. Récemment, l’IA phare de la compagnie, ChatGPT, a énormément fait parler d’elle et de ses progrès.
i know im not supposed to brag about openai, but the talent density at this scale (375 people) is 🤯 and i dont think has happened in the tech industry in recent memory
— Sam Altman (@sama) January 23, 2023
« Je sais que je ne suis pas censé me vanter d’Openai, mais la densité de talents à cette échelle (375 personnes) est 🤯 et je ne pense pas que ce soit arrivé dans l’industrie technologique ces derniers temps », a-t-il donc lancé sur le réseau social. Cette déclaration omet toutefois un point clef : celui des contractuels, qui ne sont pas embauchés directement par l’entreprise. Ils seraient pourtant essentiels au travail OpenAi, selon les propres dires de l’entreprise : « nous tenons à remercier tous nos sous-traitants pour avoir fourni les données essentielles à la formation des modèles dans cet article », peut-on lire dans l’un de leurs articles de recherche.
Selon le média Semafor, qui s’est plongé dans des offres d’emplois de contractuels, « l’entreprise derrière le chatbot ChatGPT a intensifié ses embauches dans le monde entier, attirant environ 1000 sous-traitants à distance au cours des six derniers mois dans des régions comme l’Amérique latine et l’Europe de l’Est ». Soulignons toutefois que la source de ces chiffres n’est pas très limpide : l’information proviendrait, selon le média, de « personnes familières avec le sujet ». Les chiffres sont donc à prendre avec des pincettes. En revanche, le média a pu obtenir un entretien avec un développeur sud-américain. Celui-ci se révèle très éclairant sur la nature des tâches demandées aux futurs contractuels.
Cinq heures de tests sur de l’étiquetage de données
En effet, la personne affirme avoir passé cinq heures de tests de qualification demandés par OpenAI. Non rémunérées, soit dit en passant. Les missions demandées étaient réparties en deux étapes. On lui a d’abord donné un problème de programmation puis demandé d’expliquer, à l’aide de formulations rédigées en anglais, comment il l’aborderait. Ensuite, il devait fournir une solution. S’il trouvait un bug, OpenAI lui demandait également de détailler la nature du problème, ainsi que la manière dont il devait être corrigé, au lieu de simplement apporter ses corrections. « Ils veulent très probablement alimenter ce modèle avec un type très spécifique de données d’entraînement, où l’humain fournit un schéma étape par étape de son processus de pensée », explique-t-il.
Cette série de tâches s’apparente fort à de « l’étiquetage » de données. Une ressource cruciale pour l’entraînement d’IA. En effet, les IA ne sont, la plupart du temps, autres que des programmes d’apprentissage automatique. Cela signifie qu’elles doivent être alimentées via des données pour être capables « d’apprendre » sur un domaine spécifique. Or, ChatGPT est une IA conversationnelle. Elle est principalement conçue pour produire un résultat en fonction d’une requête écrite.
On peut par exemple lui demander de rédiger une réponse à un examen de droit, de composer une poésie, ou même, dans le cas présent, de fournir des lignes de code répondant à des fonctions demandées. Les tests demandés portaient spécifiquement sur le fait d’associer du langage écrit à des lignes de code. Autrement dit, il y a là de quoi créer du matériel d’entraînement idéal pour une IA, puisqu’elle pourra « observer » à quoi un humain associe telle ou telle fonction en matière de code.
OpenAI ne part pas de zéro, loin de là. L’entreprise avait déjà développé les capacités de codage de ChatGPT. Jusqu’ici, l’idée était plutôt de développer un « assistant » pour les développeurs, leur permettant de travailler plus simplement et de détecter des erreurs dans leur code. Cette technologie, dénommée Codex, est par exemple utilisée par Microsoft pour alimenter une fonctionnalité appelée « Copilot », capable de compléter des lignes de code. Si l’entreprise intensifie effectivement ses recherches et son recrutement sur cette question du développement, il y a toutefois fort à parier que ses IA seront bientôt capables de se débrouiller toutes seules, tout du moins sur du code basique…