Cet article décrit le processus complet de XChem pour le criblage de fragments à base de cristaux, à partir de la demande d’accès et de toutes les étapes ultérieures jusqu’à la diffusion des données.
Dans la découverte de médicaments à base de fragments, des centaines, voire des milliers de composés inférieurs à ~300 Da sont testés contre la protéine d’intérêt afin d’identifier des entités chimiques qui peuvent être développées en candidats médicaments puissants. Comme les composés sont petits, les interactions sont faibles, et la méthode de criblage doit donc être très sensible ; De plus, l’information structurale tend à être cruciale pour l’élaboration de ces résultats en composés de type plomb. Par conséquent, la cristallographie des protéines a toujours été une technique de référence, mais historiquement trop difficile pour être utilisée à grande échelle comme crible primaire.
Les premières expériences XChem ont été démontrées en 2014, puis testées avec des collaborateurs académiques et industriels pour valider le procédé. Depuis lors, un effort de recherche important et un temps de faisceau important ont permis de rationaliser la préparation des échantillons, de développer une bibliothèque de fragments avec des possibilités de suivi rapide, d’automatiser et d’améliorer la capacité de la ligne de faisceau I04-1 pour la collecte de données sans surveillance, et de mettre en œuvre de nouveaux outils pour la gestion des données, l’analyse et l’identification des correspondances.
XChem est désormais une installation de criblage de fragments cristallographiques à grande échelle, prenant en charge l’ensemble du processus de dépôt de cristaux, et accessible aux utilisateurs universitaires et industriels du monde entier. Depuis 2016, le programme d’utilisateurs académiques évalués par des pairs est activement développé pour accueillir des projets d’une portée scientifique aussi large que possible, y compris des projets bien validés ainsi que des projets exploratoires. L’accès académique est attribué par le biais d’appels semestriels de propositions évaluées par les pairs, et les travaux exclusifs sont organisés par le groupe de liaison industrielle de Diamond. Ce flux de travail a déjà été appliqué en routine à plus d’une centaine de cibles dans divers domaines thérapeutiques et identifie efficacement les liants faibles (taux de réussite de 1 % à 30 %), qui servent à la fois de points de départ de haute qualité pour la conception de composés et fournissent des informations structurelles détaillées sur les sites de liaison. La résilience du processus a été démontrée par le dépistage continu des cibles du SRAS-CoV-2 pendant la pandémie de COVID-19, y compris un délai d’attente de 3 semaines pour la protéase principale.
La découverte de médicaments à base de fragments (FBDD) est une stratégie largement utilisée pour la découverte de leads, et depuis son émergence il y a 25 ans, elle a permis de mettre au point quatre médicaments à usage clinique et plus de 40 molécules ont fait l’objet d’essais cliniques 1,2,3. Les fragments sont de petites entités chimiques dont le poids moléculaire est généralement inférieur ou égal à 300 Da. Ils sont sélectionnés pour leur faible complexité chimique, qui fournit de bons points de départ pour le développement d’inhibiteurs hautement efficaces en ligands avec d’excellentes propriétés physico-chimiques. Leur taille signifie qu’ils échantillonnent le paysage de liaison des protéines de manière plus approfondie que les bibliothèques de composés plus grands de type médicament ou plomb, et révèlent ainsi également des points chauds et des sites allostériques putatifs. Combinés à des informations structurales, les fragments fournissent une carte détaillée des interactions moléculaires potentielles entre la protéine et le ligand. Néanmoins, la détection et la validation fiables de ces entités, qui ont tendance à se lier faiblement à la protéine cible, nécessitent un éventail de méthodes de criblage biophysiques robustes et sensibles telles que la résonance plasmonique de surface (SPR), la résonance magnétique nucléaire (RMN) ou la calorimétrie de titrage isotherme (ITC)4,5.
La cristallographie aux rayons X est un élément essentiel de la boîte à outils FBDD : elle est suffisamment sensible pour identifier les liants faibles et fournit directement des informations structurelles sur les interactions au niveau moléculaire. Il est complémentaire à d’autres cribles biophysiques et généralement essentiel pour faire progresser les impacts de fragments vers les composés principaux ; il nécessite des systèmes cristallins de haute qualité, ce qui signifie que la cristallisation est hautement reproductible et que les cristaux se diffractent idéalement à une résolution supérieure à 2,8 Å.
Historiquement, il a été très difficile d’utiliser la cristallographie comme crible de fragments primaires 6,7,8, que ce soit dans le milieu universitaire ou dans l’industrie. En revanche, les synchrotrons ont permis d’obtenir des améliorations d’un ordre de grandeur dans les domaines de la robotique, de l’automatisation 9,10,11 et de la technologie des détecteurs 12,13 et, combinés à une puissance de calcul et à des algorithmes de traitement des données tout aussi accélérés14,15,16, des ensembles de données complets sur la diffraction peuvent être mesurés en quelques secondes et un grand nombre d’entre eux peuvent être mesurés sans surveillance, comme l’a fait LillyCAT7 et plus tard MASSIF17,18 (European Synchrotron Radiation Facility (ESRF)). Cela a conduit les synchrotrons à développer des plates-formes hautement rationalisées pour rendre le criblage de fragments à base de cristaux comme écran primaire accessible à une large communauté d’utilisateurs (XChem à Diamond ; CrystalDirect à l’EMBL/ESRF19 ; BESSY au Helmholtz-Zentrum Berlin20 ; FragMax à MaxIV21).
Cet article documente les protocoles qui constituent la plate-forme XChem pour le criblage de fragments par cristallographie aux rayons X, de la préparation de l’échantillon jusqu’aux résultats structurels finaux des résultats modélisés en 3D. Le pipeline (figure 1) a nécessité la mise au point de nouvelles approches pour l’identification des cristaux 22, le trempage 23 et la récolte 24, ainsi qu’un logiciel de gestion des données25 et une approche algorithmique pour identifier les fragments 26 qui est maintenant largement utilisée dans la communauté. La technologie de récolte des cristaux est maintenant vendue par un fournisseur (voir Tableau des matériaux), et la disponibilité ouverte des outils a permis à d’autres synchrotrons de les adapter pour mettre en place des plates-formes équivalentes21. Les projets en cours portent sur l’analyse des données, la complétion des modèles et la diffusion des données par le biais de la plateforme Fragalysis27. Le laboratoire de préparation d’échantillons est adjacent à la ligne de faisceau I04-1, ce qui simplifie la logistique du transfert de centaines d’échantillons congelés vers la ligne de faisceau, et le temps de faisceau dédié sur I04-1 permet un retour d’information rapide sur les rayons X pour guider la campagne.
XChem fait partie intégrante du programme utilisateur de Diamond, avec deux appels par an (début avril et octobre). Le processus d’examen par les pairs a été peaufiné en consultation avec des experts en découverte de médicaments issus du milieu universitaire et de l’industrie. En plus d’un solide dossier scientifique, le processus de proposition28 exige des candidats qu’ils évaluent eux-mêmes non seulement l’état de préparation du système cristallin, mais aussi leur expertise dans les méthodes biochimiques et biophysiques orthogonales et leur capacité à faire progresser les résultats de criblage grâce à la chimie de suivi. Les modes d’accès ont également évolué pour s’adapter à la communauté multidisciplinaire des utilisateurs :
Le niveau 1 (projet unique ) concerne les projets à l’étape exploratoire et il n’est pas nécessaire de mettre en place des outils de validation des résultats (outils biophysiques ou biochimiques) et des stratégies de suivi. S’il est accepté, le projet se voit accorder un nombre réduit de décalages de temps de faisceau, suffisant pour la preuve de concept.
Le niveau 2 (projet unique) concerne les projets bien validés et nécessite la mise en place d’outils en aval et de stratégies de suivi. S’il est accepté, le projet se voit allouer suffisamment de temps de faisceau pour une campagne complète de criblage de fragments. Les projets individuels (niveau 1 ou niveau 2) doivent être achevés dans les 6 mois suivant la période d’allocation (d’avril à septembre ou d’octobre à mars).
Le groupe d’allocation de blocs (BAG) est destiné à un consortium de groupes et de projets, où un processus robuste de sélection et de priorisation des cibles est en place au sein du BAG, ainsi qu’un pipeline de suivi clair. Les BAG doivent avoir au moins un expert (superutilisateur) entièrement formé à XChem, qui coordonne leurs activités avec le personnel Diamond et forme les membres du BAG. Le nombre alloué de décalages de temps de faisceau est défini par le nombre de projets scientifiquement solides dans le BAG et est réévalué par période d’allocation sur la base du rapport du BAG. L’accès est disponible pendant 2 ans.
L’expérience XChem est divisée en trois étapes, avec un point de décision pour chacune d’entre elles : le test de tolérance au solvant, le pré-criblage et le criblage principal (Figure 2). Le test de tolérance au solvant permet de définir les paramètres de trempage, la quantité de solvant (DMSO, éthylène glycol ou autres cryoprotecteurs si nécessaire) que le système cristallin peut tolérer et pendant combien de temps. Les concentrations de solvant varient généralement de 5 % à 30 % sur au moins deux points de temps. Les données de diffraction sont collectées et comparées à la diffraction de base du système cristallin ; Cela déterminera les paramètres de trempage pour l’étape suivante. Pour le pré-criblage, 100 à 150 composés sont trempés en utilisant les conditions déterminées dans l’essai de solvant, et son but est de confirmer que les cristaux peuvent tolérer les composés dans ces conditions. Si nécessaire, le cryoprotecteur est ensuite ajouté aux gouttes contenant déjà les fragments. Les critères de succès sont que 80 % ou plus des cristaux survivent suffisamment bien pour produire des données de diffraction de bonne qualité et constantes ; En cas d’échec, les conditions de trempage sont généralement révisées en modifiant le temps de trempage ou la concentration de solvant. À la suite d’un pré-criblage réussi, le reste des composés choisis pour l’expérience peut être mis en place à l’aide des paramètres finaux.
La bibliothèque d’équilibre DSI (voir le tableau des matériaux) a été spécialement conçue pour permettre une progression rapide du suivi à l’aide de la chimie équilibrée29 et a été la bibliothèque de travail de l’établissement. Il est disponible pour les utilisateurs à une concentration de 500 mM dans le DMSO. Les utilisateurs universitaires peuvent également accéder à d’autres bibliothèques fournies par des collaborateurs (plus de 2 000 composés au total) à des concentrations de 100 à 500 mM dans le DMSO (une liste complète peut être trouvée sur le site Web28). Une grande partie de la collection globale est également disponible en éthylène glycol, pour les systèmes cristallins qui ne tolèrent pas le DMSO. Les utilisateurs peuvent également apporter leurs propres bibliothèques, à condition qu’elles soient dans des plaques compatibles avec le système acoustique de manipulation des liquides (voir Tableau des matériaux).
Pour les trois étapes de l’expérience (caractérisation du solvant, pré-criblage ou criblage complet), les procédures de préparation de l’échantillon suivantes sont identiques (Figure 3) : sélection de l’emplacement de distribution du composé par imagerie et ciblage des gouttes de cristallisation avec TeXRank22 ; distribution en gouttes à l’aide du système acoustique de distribution de liquide pour les solvants et les composés23 ; récolte efficace des cristaux à l’aide du Crystal shifter24 ; et le téléchargement d’échantillons d’informations dans la base de données de lignes de faisceau (ISPyB). L’interface actuelle pour la conception et l’exécution des expériences est une application basée sur Excel (SoakDB), qui génère les fichiers d’entrée nécessaires pour les différents équipements de la plate-forme, et suit et enregistre tous les résultats dans une base de données SQLite. Les lecteurs de codes-barres sont utilisés à différentes étapes du processus pour aider à suivre les échantillons et ces données sont ajoutées à la base de données.
Les données de diffraction sont collectées en mode sans surveillance à l’aide d’un temps de faisceau dédié sur la ligne de faisceau I04-1. Deux modes de centrage sont disponibles, à savoir optique et à rayons X17. Pour les cristaux en forme d’aiguille et de bâtonnet, le centrage des rayons X est conseillé, tandis que les cristaux plus gros prennent généralement en charge le mode optique, qui est plus rapide et, par conséquent, permet de collecter plus d’échantillons dans le temps de faisceau alloué. En fonction de la résolution des cristaux (établie avant d’entrer dans la plate-forme), la collecte de données peut être de 60 s ou 15 s d’exposition totale. La collecte de données au cours de l’étape d’essai du solvant permet généralement de déterminer quelle combinaison fonctionnera le mieux avec les performances de la ligne de faisceau I04-1.
Le grand volume d’analyse des données est géré par XChemExplorer (XCE)25, qui peut également être utilisé pour lancer l’étape d’identification des résultats à l’aide de PanDDA26. XCE est un outil de gestion des données et de flux de travail qui prend en charge l’analyse à grande échelle des structures protéine-ligand (Figure 4) ; il lit tous les résultats de traitement automatique à partir des données collectées à la source de lumière Diamond (DIALS16, Xia214, AutoPROC30 et STARANISO31) et sélectionne automatiquement l’un des résultats en fonction de la qualité des données et de la similitude avec un modèle de référence. Il est important que le modèle soit représentatif du système cristallin utilisé pour le criblage XChem et qu’il inclue toutes les eaux ou autres molécules de solvant, ainsi que tous les cofacteurs, ligands et conformations alternatives visibles dans les cristaux imbibés de solvant uniquement. La qualité de ce modèle de référence aura un impact direct sur la quantité de travail requise lors de la phase de construction et de perfectionnement du modèle. PanDDA est utilisé pour analyser toutes les données et identifier les sites de liaison. Il aligne les structures sur une structure de référence, calcule les cartes statistiques, identifie les événements et calcule les cartes d’événements26,32. Dans le paradigme PanDDA, il n’est ni nécessaire ni souhaitable de construire le modèle cristallographique complet ; Ce qui doit être modélisé est uniquement la vue de la protéine où un fragment est lié (le modèle à l’état lié), de sorte que l’accent doit être mis uniquement sur la construction du ligand et des résidus/molécules de solvant environnants selon la carte des événements32.
Le processus décrit dans cet article a été largement testé par la communauté des utilisateurs et l’adaptabilité des protocoles décrits ici est essentielle pour gérer la grande variété de projets généralement rencontrés sur la plate-forme. Cependant, quelques pré-requis du système cristallin sont nécessaires.
Pour toute campagne de criblage de fragments réalisée par cristallographie aux rayons X, il est essentiel de disposer d’un système cristallin reproductible et robuste. Comme le protocole XChem standard implique l’ajout du fragment directement à la goutte de cristal, l’optimisation doit se concentrer sur le nombre de gouttes contenant des cristaux de haute qualité plutôt que sur le nombre total de cristaux. Si les gouttes contiennent plusieurs cristaux, elles sont effectivement redondantes, bien qu’elles puissent alléger le processus de récolte. De plus, le transfert du protocole de cristallisation de l’institut d’origine aux installations sur place peut être difficile. La meilleure façon d’y parvenir est généralement d’utiliser l’ensemencement cristallin pour favoriser une nucléation reproductible54 et, par conséquent, une bonne pratique consiste pour les utilisateurs à fournir des stocks de semences avec leurs protéines et leurs solutions de cristallisation.
Pour assurer une bonne solubilité et un bon support du composé, les concentrations de trempage élevées destinées à entraîner la liaison des fragments faibles, les banques de fragments sont fournies dans des solvants organiques, en particulier le DMSO et l’éthylène glycol. La mise à disposition de deux solvants différents offre aux utilisateurs une alternative pour les cristaux qui ne tolèrent pas du tout le DMSO, ou lorsqu’il obstrue la liaison des fragments dans un site d’intérêt. Les utilisateurs peuvent fournir des bibliothèques alternatives en tampon aqueux : les composés seront bien distribués à condition qu’ils soient complètement dissous et formatés dans des plaques compatibles avec le robot de distribution de liquide.
Pour les projets où il n’est pas possible de trouver un solvant organique approprié qui permettrait à la fois de solubiliser la bibliothèque et d’être toléré par le système cristallin, une autre procédure consiste à utiliser des composés secs tels qu’établis à BESSY55.
Dans la communauté, il y a une question de longue date sur la possibilité de faire tremper des composés dans des cristaux cultivés dans des conditions de cristallisation contenant des concentrations élevées de sel. En pratique, on observe une plus grande précipitation des composés et une formation rapide de cristaux de sel au stade de la récolte, ce qui est réduit par l’application d’un environnement humide autour de la zone de récolte. En général, les campagnes de criblage dans les systèmes cristallins à partir de conditions de cristallisation à haute salinisation donnent un taux de réussite comparable à celui des conditions à faible teneur en sel.
Les premières étapes du procédé XChem (test de tolérance aux solvants et pré-criblage) sont des expériences relativement petites et rapides, mais permettent de prendre une décision claire d’acceptation ou de non-approbation du projet. Le plus pénible, c’est qu’il faudra trouver d’autres systèmes cristallins si aucun solvant n’est toléré, ou si le pré-criblage donne un taux de réussite très faible. En revanche, s’ils réussissent, les résultats informent directement sur les conditions de trempage à utiliser pour l’expérience de dépistage et sur la meilleure stratégie de collecte de données. Étant donné que la qualité des données, en particulier la résolution, affectera la qualité de la densité électronique pour l’identification et l’analyse des hits, l’objectif est de tremper à la concentration de composés la plus élevée possible qui n’a pas d’effet délétère sur la qualité de la diffraction (la majorité des ensembles de données (~80%) diffractant à une résolution de 2,8 Å ou mieux).
Le processus d’analyse des données est rationalisé dans XChemExplorer, qui s’appuie sur le logiciel PanDDA pour la détection des liants faibles et permet aux utilisateurs de visualiser et d’examiner rapidement les résultats de la campagne de criblage. XChemExplorer importe les résultats de traitement des données à partir des packages disponibles chez Diamond (DIALS 16, autoPROC 30, STARANISO31 et Xia214) avec des limites de résolution déterminées par la méthode standard pour chaque package (c’est-à-dire CC1/2 = 0.3). Par défaut, la sélection des jeux de données est basée sur un score calculé à partir de I/sigI, de l’exhaustivité et d’un certain nombre de réflexions uniques, mais des résultats de traitement spécifiques peuvent être sélectionnés pour une utilisation globale ou pour des échantillons individuels25. Les données sont également exclues de l’analyse par PanDDA en fonction de critères tels que la résolution,le R libre et la différence de volume de cellule unitaire entre les données de référence et les données cibles (les valeurs par défaut sont respectivement de 3,5 Å, 0,4 et 12 %), de sorte que les cristaux mal diffractants, mal centrés ou mal indexés n’affectent pas l’analyse.
L’algorithme PanDDA tire parti du nombre important de jeux de données collectés lors d’une campagne de fragmentation pour détecter des ligands d’occupation partielle qui ne sont pas visibles sur les cartes cristallographiques standard. Initialement, PanDDA utilise les données recueillies lors des tests de tolérance aux solvants et des étapes de pré-sélection pour préparer une carte de densité moyenne qui est ensuite utilisée pour créer un modèle d’état fondamental. Comme ce modèle sera utilisé pour toutes les étapes d’analyse ultérieures, il est essentiel qu’il représente avec précision la protéine non ligandée dans les conditions utilisées pour le criblage de fragments. PanDDA utilise ensuite une analyse statistique pour identifier les ligands liés, générant une carte d’événements pour l’état lié du cristal. Une carte d’événements est générée en soustrayant la fraction non liée du cristal de l’ensemble de données d’occupation partielle et présente ce qui serait observé si le ligand était lié à la pleine occupation. Même les fragments qui semblent clairs dans les cartesc 2mFo-DF conventionnelles peuvent être mal modélisés si les cartes d’événements ne sont pas consultées32. Bien que PanDDA soit une méthode puissante pour identifier les jeux de données qui diffèrent des cartes moyennes (ce qui est généralement indicatif de la liaison de fragments) et que des mesures telles que RSCC, RSZD, le rapport de facteur B et RMSD pendant le raffinement soient fournies pour le bénéfice des utilisateurs, l’utilisateur est en fin de compte responsable de décider si la densité observée représente avec précision le ligand attendu et la conformation la plus appropriée.
Après l’analyse et le raffinement des données, il est possible pour tous les utilisateurs de déposer simultanément plusieurs structures dans la banque de données sur les protéines (PDB) à l’aide de XChemExplorer. Pour chaque fragment-écran, deux dépositions de groupe sont effectuées. Le premier dépôt contient tous les modèles liés aux fragments, avec des coefficients pour le calcul des cartes d’événements PanDDA inclus dans les fichiers MMCIF. Le deuxième dépôt fournit le modèle d’état fondamental qui l’accompagne, ainsi que les facteurs de structure mesurés de tous les jeux de données de l’expérience : ces données peuvent être utilisées pour reproduire l’analyse PanDDA, et pour développer de futurs algorithmes. En ce qui concerne les structures des hits, lorsque l’occupation des fragments est faible, le raffinement est mieux comporté si les modèles sont un composite des structures d’état fondamental liées au ligand et confondantes32 ; Néanmoins, la pratique consiste à ne déposer que les fractions à l’état borné, car les modèles composites complets sont en général complexes et difficiles à interpréter. De ce fait, certains indicateurs de qualité recalculés par l’APB (en particulier, R/Rfree) sont parfois légèrement élevés. Il est également possible de fournir toutes les données brutes à l’aide de plates-formes telles que Zenodo56, bien que cela ne soit actuellement pas pris en charge par le pipeline XChem.
Dans l’ensemble, depuis son exploitation en 2016, des ligands fragmentaires ont pu être identifiés dans plus de 95 % des cibles à l’aide de cette procédure. L’expérience acquise dans les nombreux projets soutenus par XChem a été distillée dans les meilleures pratiques pour la préparation des cristaux33, tandis qu’une bibliothèque de fragments a été développée qui a mis en œuvre le concept d’aide à la progression des fragments29, contribuant également à établir la pratique de rendre publique la composition de la bibliothèque. La plate-forme a démontré l’importance d’une infrastructure bien entretenue et de processus documentés, détaillés ici, et a permis d’évaluer d’autres bibliothèques de fragments57,58, de comparer les bibliothèques48 et d’éclairer la conception de la bibliothèque collaborative EUOpenscreen-DRIVE 59,60.
The authors have nothing to disclose.
Ce travail représente un important effort conjoint entre la Source de Lumière Diamant et le Consortium Génomique de la Structure. Les auteurs tiennent à remercier les différents groupes de soutien et le groupe MX de Diamond pour leur contribution à l’automatisation de la ligne de lumière i04-1 et pour avoir fourni des pipelines rationalisés de collecte de données et de traitement automatique, qui sont couramment exécutés sur toutes les lignes de lumière MX. Ils tiennent également à remercier le groupe SGC PX pour sa résilience, en étant le premier utilisateur à tester la configuration et Evotec pour avoir été le premier utilisateur industriel sérieux. Ce travail a été soutenu par iNEXT-Discovery (Grant 871037) financé par le programme Horizon 2020 de la Commission européenne.
DSI-poised library | Enamine | DSI-896 | fragment library |
Echo 550 and 650 series | Beckman-Coulter | acoustic dispensing system | |
Echo microplates | Beckman-Coulter | 001-12380; 001-8768; 001-6025 | 1536-well and 384-well microplates |
Shifter | Oxford Lab Technology | harvesting device | |
Microplate centrifuge with a swing-out rotor | Sigma | model 11121 | microplate centrifuge |
3-drops crystallisation plates | Swissci | 3W96T-UVP | Crystallisation plates |
Formulatrix plate imager and Rockmaker software | Formulatrix | Crystallisation plates imaging device |