Des chercheurs ont développé un modèle d’IA basé sur l’apprentissage profond permettant à la fois de prédire l’activité « cible » et « hors cible » de l’outil d’édition génétique CRISPR-Cas13 (capable de manipuler l’ARN). Une véritable prouesse : la technique permet à la fois de réduire considérablement les erreurs d’appariement et de doser l’activité d’un gène avec une précision sans précédent.
Alors que la technique CRISPR-Cas9 est exclusivement dédiée à l’édition de l’ADN, CRISPR-Cas13, une version améliorée de l’outil d’édition génétique qui a récemment vu le jour, permet quant à elle de manipuler l’ARN. En intervenant en amont dans le processus cellulaire de transcription, le nouvel outil permet de médier plus efficacement l’inactivation de la transcription à cibler, en bloquant l’expression d’un gène particulier ou en le supprimant.
Grâce au ciblage de l’ARN, Cas13 promet de larges perspectives d’utilisation, telles que la sélection d’isoformes spécifiques dans la neurodégénéresence, ou encore l’identification de transcrits non codants modulant la prolifération des cellules cancéreuses ou la résistance à la chimiothérapie. Et, étant donné que le matériel génétique viral est principalement composé d’ARN, CRISPR Cas-13 pourrait permettre d’entraver sa multiplication par le biais d’un clivage ciblé.
« Semblables aux outils CRISPR ciblant l’ADN tels que Cas9, nous prévoyons que les outils CRISPR ciblant l’ARN tels que Cas13 auront un impact considérable sur la biologie moléculaire et les applications biomédicales dans les années à venir », suggère Neville Sanjana, professeur agrégé de biologie à l’Université de New York, membre principal du corps professoral du New York Genome Center et co-auteur principal de la nouvelle étude.
Cependant, la réalisation de ces perspectives comporte un défi majeur, notamment la conception d’ARN « guides » (ARNg) Cas13 visant les ARN non codants, les ARN viraux et les transcrits codants pour des protéines spécifiques. Tel que leur nom l’indique, ces ARN agissent en tant que guides pour les enzymes (la Cas13 dans le cas présent) ciblant l’ARN ou l’ADN, en formant des complexes avec celles-ci.
Dans la plupart des cas, ces complexes enzymatiques (ARNg-Cas13) se concentrent uniquement sur l’activité de transcription à cibler, en la supprimant, l’insérant ou la modifiant. En revanche, la prédiction de l’activité hors cible — en particulier les mutations d’insertion, le mésappariement et la délétion — est peu étudiée. En effet, environ une mutation sur cinq dans notre organisme est une insertion ou une délétion. De ce fait, il est essentiel de tenir compte de ces mutations hors cibles en appliquant la technologie CRISPR. La conception d’ARNg optimisés permet d’atteindre cet objectif.
Les chercheurs de la nouvelle étude, décrite dans la revue spécialisée Nature Biotechnology, ont réalisé un véritable exploit en relevant l’activité de plus de 200 000 ARNg. En prédisant l’activité de transcription cible et hors cible grâce à l’IA, les scientifiques ont notamment pu maîtriser CRISPR-Cas13 en supprimant complètement l’expression d’un gène ou en réduisant partiellement son activité, avec une remarquable précision. L’objectif de ce contrôle de précision est en effet de maximiser l’efficacité de l’édition génétique sur la cible prévue et de minimiser l’activité sur d’autres ARN, car cela pourrait avoir des effets indésirables sur la cellule.
Un contrôle ultraprécis de l’expression des gènes
Pour tester leur technologie, les chercheurs ont d’abord effectué une série « d’écrans » CRISPR ciblant l’ensemble de l’ARN des cellules humaines. Les écrans génétiques sont des outils permettant de définir la fonction d’un gène et d’en comprendre les interactions. Dans le cadre d’une étude datant de 2020, les mêmes experts ont démontré que cette technique permettait d’édifier un protocole efficace de conception d’ARNg-Cas13. Dans la présente recherche, ils ont mesuré l’activité de 200 000 ARNg ciblant des gènes humains clés. Cet ensemble incluait des ARNg dits « parfaits », ainsi que des guides de mésappariement, d’insertion et de délétion hors cible.
Un modèle d’apprentissage profond baptisé TIGER (inhibition ciblée de l’expression génique via la conception d’ARN guide, traduit de l’anglais) a ensuite été formé sur ces données d’écrans CRISPR. Les chercheurs tirent parti de la capacité de l’apprentissage automatique profond à traiter de très grands ensembles de données.
En comparant les prédictions générées par l’IA avec des tests empiriques sur des cellules humaines, il a été constaté que le modèle a pu prédire à la fois l’activité transcriptionelle cible et hors cible avec une grande précision. Il s’agirait ainsi du premier modèle CRISPR à ARN capable de prédire les deux activités à la fois. Autrement dit, le modèle d’IA a permis de concevoir des ARNg-Cas13 trouvant un subtil équilibre entre l’inhibition ciblée et le contournement de l’activité hors cible.
« Il est important de noter que nous avons également pu utiliser l’apprentissage automatique interprétable pour comprendre pourquoi le modèle prédit qu’un guide spécifique fonctionnera bien ou non », précise David Knowles, professeur à l’Université de Columbia et également coauteur principal de l’étude.
En outre, les experts ont démontré que les prédictions hors cible de l’IA peuvent être utilisées pour moduler ou doser l’expression d’un gène. Un gène peut en effet être partiellement exprimé selon le taux désiré, en activant l’ARNg de mésappariement adéquat. Cela pourrait par exemple produire seulement 70% du transcrit d’un gène spécifique. Cette option serait particulièrement utile pour traiter les pathologies présentant des copies excessives d’un gène, telles que le syndrome de Down ou certains cancers.