Summary

Réalisation d’un criblage efficace des fragments dans l’installation de XChem à Diamond Light Source

Published: May 29, 2021
doi:

Summary

Cet article décrit le processus complet de XChem pour le criblage de fragments à base de cristaux, à partir de la demande d’accès et de toutes les étapes ultérieures jusqu’à la diffusion des données.

Abstract

Dans la découverte de médicaments à base de fragments, des centaines, voire des milliers de composés inférieurs à ~300 Da sont testés contre la protéine d’intérêt afin d’identifier des entités chimiques qui peuvent être développées en candidats médicaments puissants. Comme les composés sont petits, les interactions sont faibles, et la méthode de criblage doit donc être très sensible ; De plus, l’information structurale tend à être cruciale pour l’élaboration de ces résultats en composés de type plomb. Par conséquent, la cristallographie des protéines a toujours été une technique de référence, mais historiquement trop difficile pour être utilisée à grande échelle comme crible primaire.

Les premières expériences XChem ont été démontrées en 2014, puis testées avec des collaborateurs académiques et industriels pour valider le procédé. Depuis lors, un effort de recherche important et un temps de faisceau important ont permis de rationaliser la préparation des échantillons, de développer une bibliothèque de fragments avec des possibilités de suivi rapide, d’automatiser et d’améliorer la capacité de la ligne de faisceau I04-1 pour la collecte de données sans surveillance, et de mettre en œuvre de nouveaux outils pour la gestion des données, l’analyse et l’identification des correspondances.

XChem est désormais une installation de criblage de fragments cristallographiques à grande échelle, prenant en charge l’ensemble du processus de dépôt de cristaux, et accessible aux utilisateurs universitaires et industriels du monde entier. Depuis 2016, le programme d’utilisateurs académiques évalués par des pairs est activement développé pour accueillir des projets d’une portée scientifique aussi large que possible, y compris des projets bien validés ainsi que des projets exploratoires. L’accès académique est attribué par le biais d’appels semestriels de propositions évaluées par les pairs, et les travaux exclusifs sont organisés par le groupe de liaison industrielle de Diamond. Ce flux de travail a déjà été appliqué en routine à plus d’une centaine de cibles dans divers domaines thérapeutiques et identifie efficacement les liants faibles (taux de réussite de 1 % à 30 %), qui servent à la fois de points de départ de haute qualité pour la conception de composés et fournissent des informations structurelles détaillées sur les sites de liaison. La résilience du processus a été démontrée par le dépistage continu des cibles du SRAS-CoV-2 pendant la pandémie de COVID-19, y compris un délai d’attente de 3 semaines pour la protéase principale.

Introduction

La découverte de médicaments à base de fragments (FBDD) est une stratégie largement utilisée pour la découverte de leads, et depuis son émergence il y a 25 ans, elle a permis de mettre au point quatre médicaments à usage clinique et plus de 40 molécules ont fait l’objet d’essais cliniques 1,2,3. Les fragments sont de petites entités chimiques dont le poids moléculaire est généralement inférieur ou égal à 300 Da. Ils sont sélectionnés pour leur faible complexité chimique, qui fournit de bons points de départ pour le développement d’inhibiteurs hautement efficaces en ligands avec d’excellentes propriétés physico-chimiques. Leur taille signifie qu’ils échantillonnent le paysage de liaison des protéines de manière plus approfondie que les bibliothèques de composés plus grands de type médicament ou plomb, et révèlent ainsi également des points chauds et des sites allostériques putatifs. Combinés à des informations structurales, les fragments fournissent une carte détaillée des interactions moléculaires potentielles entre la protéine et le ligand. Néanmoins, la détection et la validation fiables de ces entités, qui ont tendance à se lier faiblement à la protéine cible, nécessitent un éventail de méthodes de criblage biophysiques robustes et sensibles telles que la résonance plasmonique de surface (SPR), la résonance magnétique nucléaire (RMN) ou la calorimétrie de titrage isotherme (ITC)4,5.

La cristallographie aux rayons X est un élément essentiel de la boîte à outils FBDD : elle est suffisamment sensible pour identifier les liants faibles et fournit directement des informations structurelles sur les interactions au niveau moléculaire. Il est complémentaire à d’autres cribles biophysiques et généralement essentiel pour faire progresser les impacts de fragments vers les composés principaux ; il nécessite des systèmes cristallins de haute qualité, ce qui signifie que la cristallisation est hautement reproductible et que les cristaux se diffractent idéalement à une résolution supérieure à 2,8 Å.

Historiquement, il a été très difficile d’utiliser la cristallographie comme crible de fragments primaires 6,7,8, que ce soit dans le milieu universitaire ou dans l’industrie. En revanche, les synchrotrons ont permis d’obtenir des améliorations d’un ordre de grandeur dans les domaines de la robotique, de l’automatisation 9,10,11 et de la technologie des détecteurs 12,13 et, combinés à une puissance de calcul et à des algorithmes de traitement des données tout aussi accélérés14,15,16, des ensembles de données complets sur la diffraction peuvent être mesurés en quelques secondes et un grand nombre d’entre eux peuvent être mesurés sans surveillance, comme l’a fait LillyCAT7 et plus tard MASSIF17,18 (European Synchrotron Radiation Facility (ESRF)). Cela a conduit les synchrotrons à développer des plates-formes hautement rationalisées pour rendre le criblage de fragments à base de cristaux comme écran primaire accessible à une large communauté d’utilisateurs (XChem à Diamond ; CrystalDirect à l’EMBL/ESRF19 ; BESSY au Helmholtz-Zentrum Berlin20 ; FragMax à MaxIV21).

Cet article documente les protocoles qui constituent la plate-forme XChem pour le criblage de fragments par cristallographie aux rayons X, de la préparation de l’échantillon jusqu’aux résultats structurels finaux des résultats modélisés en 3D. Le pipeline (figure 1) a nécessité la mise au point de nouvelles approches pour l’identification des cristaux 22, le trempage 23 et la récolte 24, ainsi qu’un logiciel de gestion des données25 et une approche algorithmique pour identifier les fragments 26 qui est maintenant largement utilisée dans la communauté. La technologie de récolte des cristaux est maintenant vendue par un fournisseur (voir Tableau des matériaux), et la disponibilité ouverte des outils a permis à d’autres synchrotrons de les adapter pour mettre en place des plates-formes équivalentes21. Les projets en cours portent sur l’analyse des données, la complétion des modèles et la diffusion des données par le biais de la plateforme Fragalysis27. Le laboratoire de préparation d’échantillons est adjacent à la ligne de faisceau I04-1, ce qui simplifie la logistique du transfert de centaines d’échantillons congelés vers la ligne de faisceau, et le temps de faisceau dédié sur I04-1 permet un retour d’information rapide sur les rayons X pour guider la campagne.

XChem fait partie intégrante du programme utilisateur de Diamond, avec deux appels par an (début avril et octobre). Le processus d’examen par les pairs a été peaufiné en consultation avec des experts en découverte de médicaments issus du milieu universitaire et de l’industrie. En plus d’un solide dossier scientifique, le processus de proposition28 exige des candidats qu’ils évaluent eux-mêmes non seulement l’état de préparation du système cristallin, mais aussi leur expertise dans les méthodes biochimiques et biophysiques orthogonales et leur capacité à faire progresser les résultats de criblage grâce à la chimie de suivi. Les modes d’accès ont également évolué pour s’adapter à la communauté multidisciplinaire des utilisateurs :

Le niveau 1 (projet unique ) concerne les projets à l’étape exploratoire et il n’est pas nécessaire de mettre en place des outils de validation des résultats (outils biophysiques ou biochimiques) et des stratégies de suivi. S’il est accepté, le projet se voit accorder un nombre réduit de décalages de temps de faisceau, suffisant pour la preuve de concept.

Le niveau 2 (projet unique) concerne les projets bien validés et nécessite la mise en place d’outils en aval et de stratégies de suivi. S’il est accepté, le projet se voit allouer suffisamment de temps de faisceau pour une campagne complète de criblage de fragments. Les projets individuels (niveau 1 ou niveau 2) doivent être achevés dans les 6 mois suivant la période d’allocation (d’avril à septembre ou d’octobre à mars).

Le groupe d’allocation de blocs (BAG) est destiné à un consortium de groupes et de projets, où un processus robuste de sélection et de priorisation des cibles est en place au sein du BAG, ainsi qu’un pipeline de suivi clair. Les BAG doivent avoir au moins un expert (superutilisateur) entièrement formé à XChem, qui coordonne leurs activités avec le personnel Diamond et forme les membres du BAG. Le nombre alloué de décalages de temps de faisceau est défini par le nombre de projets scientifiquement solides dans le BAG et est réévalué par période d’allocation sur la base du rapport du BAG. L’accès est disponible pendant 2 ans.

L’expérience XChem est divisée en trois étapes, avec un point de décision pour chacune d’entre elles : le test de tolérance au solvant, le pré-criblage et le criblage principal (Figure 2). Le test de tolérance au solvant permet de définir les paramètres de trempage, la quantité de solvant (DMSO, éthylène glycol ou autres cryoprotecteurs si nécessaire) que le système cristallin peut tolérer et pendant combien de temps. Les concentrations de solvant varient généralement de 5 % à 30 % sur au moins deux points de temps. Les données de diffraction sont collectées et comparées à la diffraction de base du système cristallin ; Cela déterminera les paramètres de trempage pour l’étape suivante. Pour le pré-criblage, 100 à 150 composés sont trempés en utilisant les conditions déterminées dans l’essai de solvant, et son but est de confirmer que les cristaux peuvent tolérer les composés dans ces conditions. Si nécessaire, le cryoprotecteur est ensuite ajouté aux gouttes contenant déjà les fragments. Les critères de succès sont que 80 % ou plus des cristaux survivent suffisamment bien pour produire des données de diffraction de bonne qualité et constantes ; En cas d’échec, les conditions de trempage sont généralement révisées en modifiant le temps de trempage ou la concentration de solvant. À la suite d’un pré-criblage réussi, le reste des composés choisis pour l’expérience peut être mis en place à l’aide des paramètres finaux.

La bibliothèque d’équilibre DSI (voir le tableau des matériaux) a été spécialement conçue pour permettre une progression rapide du suivi à l’aide de la chimie équilibrée29 et a été la bibliothèque de travail de l’établissement. Il est disponible pour les utilisateurs à une concentration de 500 mM dans le DMSO. Les utilisateurs universitaires peuvent également accéder à d’autres bibliothèques fournies par des collaborateurs (plus de 2 000 composés au total) à des concentrations de 100 à 500 mM dans le DMSO (une liste complète peut être trouvée sur le site Web28). Une grande partie de la collection globale est également disponible en éthylène glycol, pour les systèmes cristallins qui ne tolèrent pas le DMSO. Les utilisateurs peuvent également apporter leurs propres bibliothèques, à condition qu’elles soient dans des plaques compatibles avec le système acoustique de manipulation des liquides (voir Tableau des matériaux).

Pour les trois étapes de l’expérience (caractérisation du solvant, pré-criblage ou criblage complet), les procédures de préparation de l’échantillon suivantes sont identiques (Figure 3) : sélection de l’emplacement de distribution du composé par imagerie et ciblage des gouttes de cristallisation avec TeXRank22 ; distribution en gouttes à l’aide du système acoustique de distribution de liquide pour les solvants et les composés23 ; récolte efficace des cristaux à l’aide du Crystal shifter24 ; et le téléchargement d’échantillons d’informations dans la base de données de lignes de faisceau (ISPyB). L’interface actuelle pour la conception et l’exécution des expériences est une application basée sur Excel (SoakDB), qui génère les fichiers d’entrée nécessaires pour les différents équipements de la plate-forme, et suit et enregistre tous les résultats dans une base de données SQLite. Les lecteurs de codes-barres sont utilisés à différentes étapes du processus pour aider à suivre les échantillons et ces données sont ajoutées à la base de données.

Les données de diffraction sont collectées en mode sans surveillance à l’aide d’un temps de faisceau dédié sur la ligne de faisceau I04-1. Deux modes de centrage sont disponibles, à savoir optique et à rayons X17. Pour les cristaux en forme d’aiguille et de bâtonnet, le centrage des rayons X est conseillé, tandis que les cristaux plus gros prennent généralement en charge le mode optique, qui est plus rapide et, par conséquent, permet de collecter plus d’échantillons dans le temps de faisceau alloué. En fonction de la résolution des cristaux (établie avant d’entrer dans la plate-forme), la collecte de données peut être de 60 s ou 15 s d’exposition totale. La collecte de données au cours de l’étape d’essai du solvant permet généralement de déterminer quelle combinaison fonctionnera le mieux avec les performances de la ligne de faisceau I04-1.

Le grand volume d’analyse des données est géré par XChemExplorer (XCE)25, qui peut également être utilisé pour lancer l’étape d’identification des résultats à l’aide de PanDDA26. XCE est un outil de gestion des données et de flux de travail qui prend en charge l’analyse à grande échelle des structures protéine-ligand (Figure 4) ; il lit tous les résultats de traitement automatique à partir des données collectées à la source de lumière Diamond (DIALS16, Xia214, AutoPROC30 et STARANISO31) et sélectionne automatiquement l’un des résultats en fonction de la qualité des données et de la similitude avec un modèle de référence. Il est important que le modèle soit représentatif du système cristallin utilisé pour le criblage XChem et qu’il inclue toutes les eaux ou autres molécules de solvant, ainsi que tous les cofacteurs, ligands et conformations alternatives visibles dans les cristaux imbibés de solvant uniquement. La qualité de ce modèle de référence aura un impact direct sur la quantité de travail requise lors de la phase de construction et de perfectionnement du modèle. PanDDA est utilisé pour analyser toutes les données et identifier les sites de liaison. Il aligne les structures sur une structure de référence, calcule les cartes statistiques, identifie les événements et calcule les cartes d’événements26,32. Dans le paradigme PanDDA, il n’est ni nécessaire ni souhaitable de construire le modèle cristallographique complet ; Ce qui doit être modélisé est uniquement la vue de la protéine où un fragment est lié (le modèle à l’état lié), de sorte que l’accent doit être mis uniquement sur la construction du ligand et des résidus/molécules de solvant environnants selon la carte des événements32.

Protocol

1. Soumission d’une proposition de projet Contenu de la proposition : étant donné que le programme XChem est sursouscrit, il est essentiel d’avoir des informations complètes et complètes dans la proposition pour réussir l’évaluation par les pairs.Faites valoir votre point de vue ! Présentez l’importance de la cible et placez-la dans un contexte plus large.Articuler la stratégie après la campagne de criblage des fragments : les méthodes orthogonales mises en place pour valider les hits et comment les faire progresser. Alignez les collaborations, si nécessaire. En raison de l’intensité de la partie laboratoire et de l’analyse des données, il est fortement recommandé d’affecter un cristallographe expérimenté à l’avance. Un système cristallin robuste est essentiel pour éliminer les variations techniques et les utilisateurs doivent aborder ces points essentiels.S’assurer que les conditions de cristallisation produisent des gouttes reproductibles avec des cristaux de qualité diffractante similaire dans des plaques adaptées à une utilisation sur la plate-forme avec un volume de réservoir de 30 μL (ou moins) et une taille de goutte comprise entre 200 et 500 nL. Idéalement, plus de 50 % des gouttes d’une plaque auront des cristaux d’au moins 35 μm de taille33. Assurer une qualité de diffraction constante des cristaux (2,6 Å ou mieux). Vérifier l’aptitude du système cristallin pour le criblage des fragments, y compris le compactage des cristaux et l’accessibilité des sites connus. Les preuves antérieures d’une molécule liée à ces sites sont souvent rassurantes. 2. Préparation de la visite Transfert des protocoles de cristallisation pour la cristallisation sur site.Fournir 2 x 50 mL de solution réservoir, prête à l’emploi. Fournir la solution protéique à la concentration nécessaire pour la cristallisation, prête à l’emploi en aliquotes de 30 à 50 μL. Fournir 10 mL de la solution tampon protéique. Fournir du stock de semences (même si cela n’est pas nécessaire dans le protocole de cristallisation).REMARQUE : L’ensemencement favorise la reproductibilité de la cristallisation et accélère le temps de nucléation33. Complétez le formulaire d’information sur la cristallisation disponible sur le site Web de XChem28. Fournissez les informations de stockage dans le formulaire d’expédition disponible sur le site Web de XChem28. Installez NoMachine et configurez un poste de travail distant sur Diamond (https://www.diamond.ac.uk/Users/Experiment-at-Diamond/IT-User-Guide/Not-at-DLS/Nomachine.html). Générer et transférer un bon modèle de référence, en consultation avec un cristallographe expert ou le personnel de support XChem. 3. Expérience de criblage de fragments Définition de l’emplacement de distribution du composé.Imagerie des plaques de cristallisation.Imagez toutes les plaques de cristal (voir Tableau des matériaux) nécessaires à l’expérience dans les imageurs de plaques de cristal (voir Tableau des matériaux). À l’aide du logiciel d’imagerie, générez le(s) nom(s) de la plaque dans le répertoire approprié pour le type de plaque au format suivant : Proposition Number_Plate numéro. Imprimez les codes-barres (faites un clic droit sur le nom de la plaque et sélectionnez-les dans le menu), placez-les sur le côté opposé de la plaque à partir des lettres de la rangée, placez la ou les plaques dans le port de charge avec le code-barres tourné vers l’utilisateur. Utilisez le logiciel de contrôle de l’imageur, scannez le port de charge, cliquez avec le bouton droit de la souris sur les plaques, puis sélectionnez Plaques d’image. Une fois l’imagerie terminée, retirez les plaques de l’imageur. Choix des cristaux et de l’emplacement du composéREMARQUE : Les images des gouttelettes de cristallisation sont traitées dans le pipeline Luigi à l’aide de l’algorithme Ranker basé sur les textons de TexRank pour classer les gouttelettes en fonction de la présence probable de cristaux22. Cela prend environ 10 minutes et les images seront alors disponibles dans TexRank.Ouvrez TeXRank à partir d’un PC et sélectionnez le plateau en cristal soit dans la liste en bas à droite, soit en tapant le code-barres dans la case en haut à gauche. Sélectionnez le format d’imageur approprié et la vue de puits unique. Déplacez-vous à travers les images de goutte et lorsqu’il y a un cristal qui convient à une utilisation dans une expérience, faites un clic droit loin du cristal mais à l’intérieur de la goutte – le but est de cibler où dans la goutte ajouter du solvant / composés, donc ne voulez pas frapper directement le cristal23. Continuez à travers toute la plaque et une fois terminé, sélectionnez le bouton Echo 1 Target ; Enregistrez dans le répertoire Crystal Targets sous la visite concernée. Ne modifiez pas le nom du fichier. Répétez l’opération pour toutes les autres assiettes. Distribution de composésGénération de fichiers pour la distribution de composésDans SoakDB, entrez la sélection de la bibliothèque ou les informations sur le solvant dans la table bibliothèque/solvant. Entrez le volume de goutte et le chargement dans la liste des cristaux ciblés. Générez les lots requis. Entrez les paramètres de trempage. Cliquez sur Calculer , puis sur le bouton Exporter en attente . Pour le solvant, ajoutez les différentes concentrations au tableau. Cela génère les fichiers à utiliser dans le distributeur acoustique. Si vous utilisez un cryoprotecteur, entrez la concentration et créez les fichiers de la même manière. Solutions de distribution à l’aide du distributeur acoustique (voir tableau des matériaux)Prenez la plaque source (composés ou solvant/cryoprotecteur) et faites-la tourner dans la centrifugeuse pendant 2 minutes à 1 000 x g. En cas de distribution de solvant ou de cryoprotecteur, pipeter 30 μL dans le puits correspondant sur une plaque de 384PP ; Couvrir d’un film microscellant puis centrifuger comme ci-dessus. Ouvrez le logiciel ; sélectionnez Nouveau et choisissez la plaque de puits source appropriée (384PP, 384LDV ou 1536LDV) et la classe de liquide (DMSO, CP, BP ou GP). Assurez-vous que le type de plaque correct est sélectionné comme plaque de destination. Cochez ensuite la case Personnalisé et continuez. Sélectionnez Importer et choisissez le fichier de commandes approprié. Effectuez les étapes d’importation comme demandé par le logiciel. Utilisez les cartes des plaques pour vérifier la solution à distribuer et les emplacements de destination. Exécutez le protocole en suivant les invites au fur et à mesure qu’elles s’affichent. La ou les solutions de la plaque source seront distribuées dans les gouttes de cristal choisies. Conservez l’assiette dans l’incubateur pendant le temps requis.REMARQUE : Ces paramètres sont déterminés à l’étape de caractérisation du solvant, la température sera de 4 °C ou 20 °C en fonction de la température de croissance des cristaux et les temps sont généralement compris entre 1 h et 3 h. Récolte des cristaux à l’aide du dispositif semi-automatique de récolte des cristaux (voir Table des matériaux).REMARQUE : Si une cryoprotection est nécessaire, répétez l’étape 3.2.2 pour l’ajout de solutions cryoprotectrices sur les gouttes de cristaux avant de prélever les échantillons.Préparation à la récoltePréparez les fichiers requis pour la collecte dans SoakDB. Lorsqu’on vous le demande, confirmez que les trempages sont terminés et que les lots sont terminés. Scannez le nombre de rondelles requises pour l’expérience sous le bon numéro de proposition. Sélectionnez un plateau de boucles de taille appropriée pour les cristaux (35 μm, 75 μm ou 150 μm). Il est important de choisir une taille de boucle qui correspond le plus possible à la taille du cristal afin de permettre un centrage automatique sur la ligne de faisceau plus précis, d’améliorer la qualité des données en réduisant le bruit de fond et d’éliminer le besoin de cryoprotecteur. Ouvrez le logiciel approprié et ouvrez l’onglet Workflow. Scannez les rondelles dans le logiciel et faites défiler vers le haut de la liste, en mettant en surbrillance la première rondelle. Placez les rondelles dans un dewar en mousse et refroidissez-les avec de l’azote liquide. Choisissez Importer un fichier à partir de SoakDB et sélectionnez le lot à récolter ; Vérifiez si le lot est affecté au titulaire gauche. Une liste de travail s’affiche. Prenez la plaque de cristal, retirez le sceau et mettez-le dans le support de gauche ; Déplacez la plaque en position de stationnement. Récolte des cristauxInstallez-vous confortablement et appuyez sur le bouton Démarrer le flux de travail (l’écran est un écran tactile) pour passer à la première position de puits sélectionnée. Si le cristal a survécu, montez le cristal dans la boucle et plongez-le dans l’azote liquide en le plaçant en position 1 dans la première rondelle de la liste. Sélectionnez la description appropriée pour le cristal dans l’interface (normal, fondu, fissuré, gélatineux ou coloré). S’il s’agit d’un trempage composé, notez la description de l’état du composé (clair, cristallin, précipité, mauvaise distribution ou séparation de phase). Si le cristal a été monté avec succès, sélectionnez Monté sinon sélectionnez Échec. La plaque se déplacera vers le prochain puits sélectionné. Remplissez toutes les positions de la rondelle consécutivement (ne laissez pas d’espace si un cristal a échoué). Continuez jusqu’à la fin du flux de travail. À la fin du flux de travail, chargez tous les lots supplémentaires et continuez à remplir les rondelles dans l’ordre. Il n’est pas nécessaire de commencer une nouvelle rondelle pour un nouveau lot. Suivi par code-barres des résultats de la récolteUne fois que tous les cristaux ont été récoltés, apportez les rondelles au lecteur de codes-barres, placez-les une à la fois dans le support pour scanner la rondelle et épingler les codes-barres. Lorsque cela est terminé, mettez les couvercles sur les rondelles et stockez-les dans un dewar de stockage d’azote liquide. Chargez le fichier de sortie dans l’interface SoakDB. Enregistrement d’informations sur l’échantillon dans ISPyB34,35,36Charger des exemples de données dans ISPyBDans SoakDB, mettez à jour la ligne de faisceau, visitez Mise à jour pour ISPyB et cliquez sur Exporter pour créer le fichier à télécharger dans ISPyB. Mastic ouvert. Connectez-vous et accédez au répertoire suivant : dls/labxchem/data/year/lbXXXX-1/processing/lab36/ispyb. Exécutez le script csv2ispyb (csv2ispyb lbXXXX-1-date.csv)REMARQUE : Les échantillons sont maintenant chargés dans ISPyB. Consigner l’emplacement de la rondelle et la stratégie de collecte de données.Consigner les détails et l’emplacement des rondellesREMARQUE : Il est important de consigner les détails et l’emplacement des rondelles afin qu’elles puissent être localisées et chargées sur la ligne de faisceau.Dans SoakDB, ouvrez le deuxième onglet intitulé Rondelles. Remplissez les détails dans les cases en haut. Plus précisément, l’emplacement des rondelles (dewar d’entreposage et cannes), les paramètres de collecte de données, y compris la résolution prévue et le numéro de proposition. Cliquez sur le bouton Enregistrer et une liste de toutes les rondelles apparaîtra dans le tableau. Copiez les rondelles récemment remplies. Ouvrez la feuille de calcul de la file d’attente XChem (raccourci sur le bureau) et collez les informations. Remplissez toute information supplémentaire pertinente. 4. Collecte des données REMARQUE : Les données sont collectées en mode sans surveillance et gérées par l’équipe XChem/ligne de faisceau. Collecte d’échantillons mal centrés.REMARQUE : Ceux-ci sont nécessaires lorsqu’il y a eu des problèmes avec la collecte de données pour certains échantillons, probablement causés par des broches mal centrées correctement.Examinez la vue du passeur d’échantillons dans ISPyB, sélectionnez Classer par point d’accès pour classer les échantillons en fonction de la résolution du traitement automatique dans une gradation de couleur du vert au rouge. Cliquez sur les échantillons pour vérifier s’il y a des échantillons rouges ou jaunes.REMARQUE : Cela fera apparaître la collecte de données. Vérifiez les instantanés du cristal pour voir si le cristal est centré. Notez tous ceux qui ne sont pas centrés et envoyez-les au contact local qui se chargera de récupérer les échantillons manquants. 5. Analyse des données Récupération et analyse des résultats de traitement automatique de Diamond via XChemExplorer (XCE)25.Dans un terminal, allez dans le sous-dossier Traitement : cd /dls/labxchem/data/year/visit/processing ou pour les BAGs XChem : cd /dls/labxchem/data/year/visit/processing/project/processing/. Utilisez l’alias xce pour ouvrir XChemExplorer. Sélectionnez le bouton Mettre à jour les tables à partir de la source de données . Sous l’onglet Vue d’ensemble , vous trouverez un résumé des données expérimentales. Ajoutez des catégories supplémentaires à l’aide de l’option Sélectionner les colonnes à afficher dans le menu Source de données . Sous l’onglet Paramètres , sélectionnez le répertoire de collecte de données (/dls/i04-1/data/year/visit/). Ouvrez l’onglet Jeux de données, choisissez la cible dans le menu déroulant Sélectionner la cible, sélectionnez Get Nouveaux résultats à partir du traitement automatique à partir du menu déroulant Jeux de données, puis cliquez sur Exécuter.REMARQUE : XCE va maintenant analyser la visite de collecte de données pour les résultats du traitement automatique. Cela peut prendre un certain temps la première fois qu’il est exécuté, en fonction du nombre de jeux de données/répertoires analysés. Vérifiez la cohérence et la qualité des données en vérifiant la résolution, le groupe d’espaces et Rmerge. Exclure les données d’une résolution inférieure à 2,8 Å.REMARQUE : Par défaut, la sélection du jeu de données est basée sur un score calculé à partir de I/sigI, de l’exhaustivité et du nombre de réflexions uniques, mais d’autres résultats de traitement peuvent être sélectionnés pour une utilisation25. Pour sélectionner un résultat de traitement différent pour des jeux de données individuels, si vous préférez, cliquez sur ID d’échantillon et choisissez le programme/l’exécution souhaité. Pour modifier le pipeline de traitement de tous les jeux de données, sélectionnez Modifier les préférences dans le menu Préférences , puis modifiez le mécanisme de sélection du jeu de données. Si nécessaire, retraitez les données via ISPyB37. Si aucune donnée traitée pour un échantillon n’est acceptable, étiquetez comme Échec de l’exclusion de l’analyse ultérieure. Lorsque vous avez terminé, cliquez sur Mettre à jour les tables à partir de la source de données pour ajouter des données aux tables suivantes. Calcul des cartes initiales à l’aide de DIMPLE38.Ouvrez l’onglet Cartes , choisissez le modèle de référence dans le menu déroulant et sélectionnez les jeux de données souhaités, puis exécutez DIMPLE sur les fichiers MTZ sélectionnés. XCE exécute de nombreuses tâches DIMPLE simultanément sur le cluster de Diamond. Recherchez l’état de ces travaux dans la colonne État des fossettes et actualisez-les à l’aide du bouton Mettre à jour les tables à partir de la source de données ou à l’aide de la commande qstat sous Linux. Une fois l’opération terminée, vérifiez si les valeurs Dimple Rcryst, Dimple Rfree et Space Group sont acceptables. Si nécessaire (Rfree élevé/groupe d’espace incorrect/grande différence dans le volume unitaire de cellule), modifiez les résultats du traitement automatique comme décrit précédemment et répétez la génération de la carte pour ces jeux de données. Génération de contraintes de ligands à l’aide de Grade39, AceDRG40 ou phenix.eLBOW41.Sélectionnez le programme souhaité (Préférences, Modifier les préférences, Programme de génération de contraintes), puis sélectionnez les jeux de données sous l’onglet Cartes, puis exécutez Créer un fichier CIF/PDB/PNG de composés SÉLECTIONNÉS dans la liste déroulante Cartes et contraintes . Actualisez l’état de ces tâches qui se trouvent dans la colonne Statut composé à l’aide du bouton Mettre à jour les tables à partir de la source de données . Création du modèle d’état fondamental (pré-exécution)NOTE : Le terme modèle d’état fondamental représente la structure de la protéine sous sa forme sans ligand, telle qu’observée dans 100 ensembles de données (ce nombre est choisi arbitrairement). Étant donné que le modèle d’état fondamental est utilisé comme référence pour la construction de l’état lié au ligand, il est essentiel de construire un modèle précis de l’état fondamental, incluant toutes les molécules de solvant et d’eau, avant l’analyse de l’ensemble de la campagne de criblage des fragments. Au cours de cette étape, les cent premiers jeux de données de plus haute résolution marqués par PanDDA comme manquant d’événements intéressants (et donc probablement sans ligand) sont utilisés pour générer la carte moyenne de l’état fondamental, tandis que l’ensemble de données avec le Rlibre le plus faible est sélectionné pour l’affinement. La carte moyenne de l’état fondamental n’est pas une carte cristallographique, cependant, il est important de n’utiliser cette carte que pour la construction du modèle de l’état fondamental.Ouvrez l’onglet PanDDAs et mettez à jour les tables à partir de la source de données si nécessaire. Définissez le répertoire de sortie (/dls/labxchem/data/year/visit/processing/analysis/panddas). Sélectionnez Pré-exécution pour le modèle d’état fondamental et cliquez sur Exécuter.REMARQUE : Les jeux de données avec un Rfree élevé et des groupes d’espaces inattendus doivent être automatiquement exclus de l’analyse. Pour exclure manuellement les jeux de données avec un Rfree élevé et des groupes d’espaces inattendus, sélectionnez Ignorer complètement. Vérifiez l’état de la tâche de pré-exécution à l’aide de qstat dans une fenêtre de terminal. Une fois terminé, sélectionnez Construire un modèle d’état fondamental et cliquez sur Exécuter.REMARQUE : Cela ouvrira Coot avec la carte moyenne PanDDA et un modèle de référence/2Fo-Fc/Fo-Fc à partir de l’ensemble de données de la meilleure qualité pour la remodélisation et l’affinement à l’aide de Coot. Il est de la plus haute importance que seule la carte moyenne PanDDA soit utilisée pour la modélisation. Identification des accès à l’aide de PanDDA26Analyse PanDDAREMARQUE : L’exécution sur le cluster peut prendre un certain temps s’il existe un grand nombre de jeux de données, si la cellule unitaire est grande et s’il existe plusieurs copies de la protéine dans l’unité asymétrique.Répétez les étapes décrites précédemment pour Analyser les résultats du traitement automatique DLS et Calcul initial de la carte. Pour le calcul de la carte, utilisez le modèle d’état fondamental comme référence : Actualiser la liste des fichiers de référence > Définir une nouvelle référence et générer des contraintes de ligand si nécessaire pour les nouvelles données (étapes 6.1 à 6.3). Sous l’onglet PanDDAs , assurez-vous que le répertoire de sortie est défini comme précédemment et exécutez pandda.analyse à partir du menu déroulant Identification des résultats . Vérifiez l’état de la tâche dans le terminal Linux à l’aide de la commande qstat. PanDDA inspect – vérification/création d’événements de liaison Sous l’onglet PanDDAs dans XCE, exécutez pandda.inspect à partir du menu déroulant Identification des résultats pour ouvrir Coot42 avec le panneau de configuration PanDDA.REMARQUE : Le panneau de configuration pandda.inspect fournit un résumé des statistiques PanDDA et permet aux utilisateurs de naviguer dans les événements/sites de liaison. Un fichier HTML récapitulatif des résultats est également généré et peut être mis à jour pendant l’inspection en sélectionnant Mettre à jour le code HTML. Pour modéliser un ligand, cliquez sur Fusionner le ligand avec le modèle et Enregistrer le modèle avant d’accéder à un autre événement pour éviter de perdre les modifications apportées au modèle à états limites.REMARQUE : Seuls les modèles qui ont été mis à jour et enregistrés seront exportés pour être affinés ultérieurement. Utilisez le champ Commentaire d’événement pour annoter l’événement de liaison et les informations sur le site d’enregistrement pour annoter les sites de liaison. Moyenne de charge et cartes 2mFo-DFc (à partir de DIMPLE) pour comparaison avec la carte et le modèle d’événements.Une fois que tous les ligands viables ont été modélisés, fusionnés et enregistrés sur la base de la carte des événements, fermez pandda.inspect. Exportation et raffinement de PanDDAREMARQUE : Les modèles d’inspection PanDDA suivants sont réexportés dans le répertoire du projet et une première série d’affinements est lancée. Il existe actuellement deux pipelines disponibles pour le faire sous l’onglet PANDDA dans XCE.L’option Exporter les modèles NOUVEAU/TOUS/SÉLECTIONNÉS PANDDA génère un ensemble de modèles liés et non liés à des fins d’affinement et génère des paramètres de restriction d’occupation pour Refmac43.REMARQUE : Le modèle d’ensemble sera utilisé pour l’affinement, mais seul le modèle à états limites sera mis à jour dans Coot et déposé dans la PDB. Ce pipeline est mieux utilisé pour les ensembles de données avec des fragments à faible taux d’occupation et des modifications significatives du modèle protéique. Affiner les modèles à états limites NEW/ALL avec BUSTER affine l’état limite uniquement avec Buster44.REMARQUE : Il est préférable de l’utiliser avec des ligands/ensembles de données à occupation élevée avec des modifications minimales du modèle de protéine. Affinement des résultats (tous les jeux de données sélectionnés pour l’affinement seront désormais visibles dans l’onglet Affinement). Sélectionnez Ouvrir COOT – BUSTER Refinement ou Open COOT – REFMAC Refinement dans le menu déroulant Affinement pour ouvrir Coot avec le panneau de configuration XCE Refinement.Sélectionnez l’état des échantillons à affiner dans le menu déroulant Sélectionner des échantillons (généralement 3 – en cours d’affinement) et cliquez sur GO.REMARQUE : Le panneau de configuration XCE fournit un résumé du nombre de jeux de données pour cette catégorie et permet la navigation entre les jeux de données tout en fournissant un résumé des statistiques d’affinement. Annotez la confiance du ligand dans le panneau de configuration XCE : 0 – aucun ligand présent – Le fragment n’est pas lié ; 1 – Faible niveau de confiance – Le fragment s’est peut-être lié mais n’est pas particulièrement convaincant ; 2 – Ligand correct, faible densité – L’utilisateur est sûr que le fragment s’est lié mais qu’il est faible / il y a quelques problèmes avec les cartes ; 3 – Densité claire, ligand inattendu – Les cartes indiquent clairement la liaison du ligand qui n’est pas corrélée à la structure chimique fournie ; 4 – Confiance élevée – Le ligand est lié sans ambiguïté. Apportez les modifications nécessaires au modèle à ce stade et lancez un perfectionnement supplémentaire à l’aide du bouton Affiner . Utilisez le bouton Afficher la liste des tâches de MolProbity pour accéder à l’analyse MolProbity45 exécutée sur tous les cycles d’affinement. Si nécessaire, ajoutez des paramètres d’affinement, par exemple pour les facteurs de température anisotropes, les données jumelées ou l’affinement de l’occupation en sélectionnant le bouton Paramètres d’affinement .REMARQUE : Des statistiques de traitement des données sont également fournies dans XCE sous l’onglet Raffinement et si l’affinement est effectué avec le pipeline Buster, des rapports Buster, y compris l’analyse MOGUL46, sont fournis. Modifiez l’état d’un jeu de données au fur et à mesure de sa progression dans l’affinement dans la fenêtre principale XCE sous l’onglet Affinement ou dans le panneau de configuration Coot XCE . Lorsque vous êtes convaincu que le modèle est précis autour du ligand et qu’il peut être partagé pour une analyse plus approfondie, définissez l’état sur CompChem Ready. Lorsque l’affinement est terminé et que le modèle est prêt à être téléchargé dans la base de données pluggable, définissez l’état sur Dépôt prêt. 6. Dépôt des données REMARQUE : Tous les jeux de données d’un écran de fragment et le modèle d’état fondamental utilisé pour générer les cartes d’événements PanDDA peuvent être déposés dans la base de données PDB à l’aide de dépôts de groupe. Convertissez toutes les cartes d’événements PanDDA au format MTZ en exécutant Event Map ->SF à partir du menu Identification des accès . Fournissez des métadonnées supplémentaires, telles que les auteurs et les méthodes, en sélectionnant Déposer > Modifier les informations. Remplissez tous les éléments requis et cliquez sur Enregistrer dans la base de données , puis enregistrez ces informations pour le dépôt du modèle d’état fondamental. Effectuez cette opération une fois que l’état du modèle a été modifié en Prêt pour le dépôt. Dans l’onglet Dépôt , sélectionnez le bouton Préparer mmcif pour générer des fichiers mmcif de facteur de structure pour tous les jeux de données prêts pour le dépôt . Le message suivant s’affiche dans la fenêtre du terminal une fois cette opération terminée : Préparation terminée des fichiers mmcif pour le dépôt wwPDB. Sélectionnez le bouton Copier mmcif pour copier tous ces fichiers dans une seule archive tar compressée dans le répertoire de dépôt de groupe de la visite. Allez à https://deposit-group-1.rcsb.rutgers.edu/groupdeposit ; Connectez-vous avec le nom d’utilisateur : GroupTester et le mot de passe : !2016RCSBPDB. Créez une session et chargez le fichier ligand-bound.tar.bz2 à partir du répertoire de dépôt de groupe. Une fois que les structures liées au ligand ont été soumises avec succès, un e-mail est envoyé avec les codes PDB. Sélectionnez Mettre à jour la base de données avec les codes PDB dans le menu Dépôt ; copiez et collez les informations de cet e-mail dans la fenêtre contextuelle et cliquez sur Mettre à jour la base de données pour ajouter des ID PDB. Afin de déposer le modèle d’état fondamental utilisé par PanDDA, sélectionnez le répertoire PanDDA approprié dans XCE et exécutez apo->mmcif dans le menu Identification des accès .REMARQUE : XCE sélectionnera arbitrairement une structure haute résolution avec un faible Rfree comme modèle pour le faisceau de dépôt, puis compilera tous les fichiers mmcif de facteur de structure en un seul fichier. Dans l’onglet Dépôt, sélectionnez le bouton Ajouter à la base de données sous la section Dépôt groupé du modèle d’état fondamental. Entrez les métadonnées du modèle d’état fondamental (à nouveau en sélectionnant Dépôt > Modifier les informations), chargez le fichier précédent et Enregistrer dans la base de données. Préparez le fichier mmcif à l’état fondamental en exécutant Préparer mmcif à partir de la section Dépôt groupé du modèle à l’état fondamental et, lorsque vous avez terminé, copiez le fichier mmcif dans le répertoire Dépôt de groupe en sélectionnant le bouton Copier mmcif dans la même section. Comme précédemment, allez à https://deposit-group-1.rcsb.rutgers.edu/groupdeposit ; Connectez-vous avec le nom d’utilisateur : GroupTester et le mot de passe : !2016RCSBPDB. Créez une session et téléchargez le fichier ground_state_structures.tar.bz2 à partir du répertoire de dépôt de groupe.

Representative Results

Le pipeline XChem pour le criblage de fragments par cristallographie aux rayons X a été considérablement rationalisé, ce qui a permis son adoption par la communauté scientifique (Figure 5). Ce processus a été validé sur plus de 150 campagnes de dépistage avec un taux de réussite variant entre 1 % et 30 ,48,49,50,51,52 et par de nombreux utilisateurs réguliers. Les systèmes cristallins qui ne conviennent pas (faible résolution, qualité de cristallisation ou de diffraction incohérente) ou qui ne tolèrent ni le DMSO ni l’éthylène glycol sont éliminés dès le début du processus, ce qui permet d’économiser du temps, des efforts et des ressources. Les campagnes réussies fournissent une carte tridimensionnelle des sites d’interaction potentiels sur la protéine cible ; un résultat typique est le dépistage XChem de la protéase principale du SRAS-CoV-2 (Figure 6). En règle générale, les occurrences de fragments se trouvent dans : (a) des sites d’intérêt connus, tels que des sites actifs enzymatiques et des sous-poches48 ; (b) les sites allostériques putatifs, par exemple, dans les interactions protéine-protéine53 ; (c) les interfaces d’empilement de cristaux, généralement considérées comme des faux positifs (figure 6). Ces données structurales fournissent généralement une base pour la fusion, la liaison ou la croissance des fragments en petites molécules de type plomb 1,3. Figure 1 : Le pipeline XChem. La plate-forme est représentée schématiquement, de la proposition de projet à la préparation des échantillons, en passant par la collecte de données et l’identification des résultats. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 2 : Stratégie de dépistage. Le workflow indique l’objectif de chaque jalon, les exigences de l’expérience et les points de décision. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 3 : Flux de travail de préparation des échantillons. Les étapes critiques pour la préparation de l’échantillon sont représentées, les informations de chaque étape étant enregistrées dans une base de données SQLite. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 4 : Analyse des données à l’aide de XCE. Les étapes critiques de l’analyse des données sont représentées par un diagramme de flux de travail avec les progiciels correspondants. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 5 : Évolution du programme utilisateur XChem : Le graphique montre l’adoption et la consolidation du programme utilisateur de 2015 à 2019 avec la création des BAG en 2019 et la résilience de la plateforme pendant la pandémie de COVID-19 en 2020. Veuillez cliquer ici pour voir une version agrandie de cette figure. Figure 6 : Résultats représentatifs de l’écran de fragments XChem. Le dimère principal de la protéase du SRAS-CoV2 (Mpro) est représenté en surface avec les occurrences du site actif en jaune, les occurrences allostériques putatives en magenta et les artefacts de surface/d’empilement cristallin en vert. La figure a été réalisée à l’aide d’entrées de Chimera et de M pro PDB provenant de la dépositionde groupe G_1002156. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Discussion

Le processus décrit dans cet article a été largement testé par la communauté des utilisateurs et l’adaptabilité des protocoles décrits ici est essentielle pour gérer la grande variété de projets généralement rencontrés sur la plate-forme. Cependant, quelques pré-requis du système cristallin sont nécessaires.

Pour toute campagne de criblage de fragments réalisée par cristallographie aux rayons X, il est essentiel de disposer d’un système cristallin reproductible et robuste. Comme le protocole XChem standard implique l’ajout du fragment directement à la goutte de cristal, l’optimisation doit se concentrer sur le nombre de gouttes contenant des cristaux de haute qualité plutôt que sur le nombre total de cristaux. Si les gouttes contiennent plusieurs cristaux, elles sont effectivement redondantes, bien qu’elles puissent alléger le processus de récolte. De plus, le transfert du protocole de cristallisation de l’institut d’origine aux installations sur place peut être difficile. La meilleure façon d’y parvenir est généralement d’utiliser l’ensemencement cristallin pour favoriser une nucléation reproductible54 et, par conséquent, une bonne pratique consiste pour les utilisateurs à fournir des stocks de semences avec leurs protéines et leurs solutions de cristallisation.

Pour assurer une bonne solubilité et un bon support du composé, les concentrations de trempage élevées destinées à entraîner la liaison des fragments faibles, les banques de fragments sont fournies dans des solvants organiques, en particulier le DMSO et l’éthylène glycol. La mise à disposition de deux solvants différents offre aux utilisateurs une alternative pour les cristaux qui ne tolèrent pas du tout le DMSO, ou lorsqu’il obstrue la liaison des fragments dans un site d’intérêt. Les utilisateurs peuvent fournir des bibliothèques alternatives en tampon aqueux : les composés seront bien distribués à condition qu’ils soient complètement dissous et formatés dans des plaques compatibles avec le robot de distribution de liquide.

Pour les projets où il n’est pas possible de trouver un solvant organique approprié qui permettrait à la fois de solubiliser la bibliothèque et d’être toléré par le système cristallin, une autre procédure consiste à utiliser des composés secs tels qu’établis à BESSY55.

Dans la communauté, il y a une question de longue date sur la possibilité de faire tremper des composés dans des cristaux cultivés dans des conditions de cristallisation contenant des concentrations élevées de sel. En pratique, on observe une plus grande précipitation des composés et une formation rapide de cristaux de sel au stade de la récolte, ce qui est réduit par l’application d’un environnement humide autour de la zone de récolte. En général, les campagnes de criblage dans les systèmes cristallins à partir de conditions de cristallisation à haute salinisation donnent un taux de réussite comparable à celui des conditions à faible teneur en sel.

Les premières étapes du procédé XChem (test de tolérance aux solvants et pré-criblage) sont des expériences relativement petites et rapides, mais permettent de prendre une décision claire d’acceptation ou de non-approbation du projet. Le plus pénible, c’est qu’il faudra trouver d’autres systèmes cristallins si aucun solvant n’est toléré, ou si le pré-criblage donne un taux de réussite très faible. En revanche, s’ils réussissent, les résultats informent directement sur les conditions de trempage à utiliser pour l’expérience de dépistage et sur la meilleure stratégie de collecte de données. Étant donné que la qualité des données, en particulier la résolution, affectera la qualité de la densité électronique pour l’identification et l’analyse des hits, l’objectif est de tremper à la concentration de composés la plus élevée possible qui n’a pas d’effet délétère sur la qualité de la diffraction (la majorité des ensembles de données (~80%) diffractant à une résolution de 2,8 Å ou mieux).

Le processus d’analyse des données est rationalisé dans XChemExplorer, qui s’appuie sur le logiciel PanDDA pour la détection des liants faibles et permet aux utilisateurs de visualiser et d’examiner rapidement les résultats de la campagne de criblage. XChemExplorer importe les résultats de traitement des données à partir des packages disponibles chez Diamond (DIALS 16, autoPROC 30, STARANISO31 et Xia214) avec des limites de résolution déterminées par la méthode standard pour chaque package (c’est-à-dire CC1/2 = 0.3). Par défaut, la sélection des jeux de données est basée sur un score calculé à partir de I/sigI, de l’exhaustivité et d’un certain nombre de réflexions uniques, mais des résultats de traitement spécifiques peuvent être sélectionnés pour une utilisation globale ou pour des échantillons individuels25. Les données sont également exclues de l’analyse par PanDDA en fonction de critères tels que la résolution,le R libre et la différence de volume de cellule unitaire entre les données de référence et les données cibles (les valeurs par défaut sont respectivement de 3,5 Å, 0,4 et 12 %), de sorte que les cristaux mal diffractants, mal centrés ou mal indexés n’affectent pas l’analyse.

L’algorithme PanDDA tire parti du nombre important de jeux de données collectés lors d’une campagne de fragmentation pour détecter des ligands d’occupation partielle qui ne sont pas visibles sur les cartes cristallographiques standard. Initialement, PanDDA utilise les données recueillies lors des tests de tolérance aux solvants et des étapes de pré-sélection pour préparer une carte de densité moyenne qui est ensuite utilisée pour créer un modèle d’état fondamental. Comme ce modèle sera utilisé pour toutes les étapes d’analyse ultérieures, il est essentiel qu’il représente avec précision la protéine non ligandée dans les conditions utilisées pour le criblage de fragments. PanDDA utilise ensuite une analyse statistique pour identifier les ligands liés, générant une carte d’événements pour l’état lié du cristal. Une carte d’événements est générée en soustrayant la fraction non liée du cristal de l’ensemble de données d’occupation partielle et présente ce qui serait observé si le ligand était lié à la pleine occupation. Même les fragments qui semblent clairs dans les cartesc 2mFo-DF conventionnelles peuvent être mal modélisés si les cartes d’événements ne sont pas consultées32. Bien que PanDDA soit une méthode puissante pour identifier les jeux de données qui diffèrent des cartes moyennes (ce qui est généralement indicatif de la liaison de fragments) et que des mesures telles que RSCC, RSZD, le rapport de facteur B et RMSD pendant le raffinement soient fournies pour le bénéfice des utilisateurs, l’utilisateur est en fin de compte responsable de décider si la densité observée représente avec précision le ligand attendu et la conformation la plus appropriée.

Après l’analyse et le raffinement des données, il est possible pour tous les utilisateurs de déposer simultanément plusieurs structures dans la banque de données sur les protéines (PDB) à l’aide de XChemExplorer. Pour chaque fragment-écran, deux dépositions de groupe sont effectuées. Le premier dépôt contient tous les modèles liés aux fragments, avec des coefficients pour le calcul des cartes d’événements PanDDA inclus dans les fichiers MMCIF. Le deuxième dépôt fournit le modèle d’état fondamental qui l’accompagne, ainsi que les facteurs de structure mesurés de tous les jeux de données de l’expérience : ces données peuvent être utilisées pour reproduire l’analyse PanDDA, et pour développer de futurs algorithmes. En ce qui concerne les structures des hits, lorsque l’occupation des fragments est faible, le raffinement est mieux comporté si les modèles sont un composite des structures d’état fondamental liées au ligand et confondantes32 ; Néanmoins, la pratique consiste à ne déposer que les fractions à l’état borné, car les modèles composites complets sont en général complexes et difficiles à interpréter. De ce fait, certains indicateurs de qualité recalculés par l’APB (en particulier, R/Rfree) sont parfois légèrement élevés. Il est également possible de fournir toutes les données brutes à l’aide de plates-formes telles que Zenodo56, bien que cela ne soit actuellement pas pris en charge par le pipeline XChem.

Dans l’ensemble, depuis son exploitation en 2016, des ligands fragmentaires ont pu être identifiés dans plus de 95 % des cibles à l’aide de cette procédure. L’expérience acquise dans les nombreux projets soutenus par XChem a été distillée dans les meilleures pratiques pour la préparation des cristaux33, tandis qu’une bibliothèque de fragments a été développée qui a mis en œuvre le concept d’aide à la progression des fragments29, contribuant également à établir la pratique de rendre publique la composition de la bibliothèque. La plate-forme a démontré l’importance d’une infrastructure bien entretenue et de processus documentés, détaillés ici, et a permis d’évaluer d’autres bibliothèques de fragments57,58, de comparer les bibliothèques48 et d’éclairer la conception de la bibliothèque collaborative EUOpenscreen-DRIVE 59,60.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Ce travail représente un important effort conjoint entre la Source de Lumière Diamant et le Consortium Génomique de la Structure. Les auteurs tiennent à remercier les différents groupes de soutien et le groupe MX de Diamond pour leur contribution à l’automatisation de la ligne de lumière i04-1 et pour avoir fourni des pipelines rationalisés de collecte de données et de traitement automatique, qui sont couramment exécutés sur toutes les lignes de lumière MX. Ils tiennent également à remercier le groupe SGC PX pour sa résilience, en étant le premier utilisateur à tester la configuration et Evotec pour avoir été le premier utilisateur industriel sérieux. Ce travail a été soutenu par iNEXT-Discovery (Grant 871037) financé par le programme Horizon 2020 de la Commission européenne.

Materials

DSI-poised library Enamine DSI-896 fragment library
Echo 550 and 650 series Beckman-Coulter acoustic dispensing system
Echo microplates Beckman-Coulter 001-12380; 001-8768; 001-6025 1536-well and 384-well microplates
Shifter Oxford Lab Technology harvesting device
Microplate centrifuge with a swing-out rotor Sigma model 11121 microplate centrifuge
3-drops crystallisation plates Swissci 3W96T-UVP Crystallisation plates
Formulatrix plate imager and Rockmaker software Formulatrix Crystallisation plates imaging device

References

  1. Erlanson, D. A., Fesik, S. W., Hubbard, R. E., Jahnke, W., Jhoti, H. Twenty years on: The impact of fragments on drug discovery. Nature Reviews Drug Discovery. 15 (9), 605-619 (2016).
  2. Jacquemard, C., Kellenberger, E. A bright future for fragment-based drug discovery: what does it hold. Expert Opinion on Drug Discovery. 14 (5), 413-416 (2019).
  3. Jahnke, W., et al. Fragment-to-lead medicinal chemistry publications in 2019. Journal of Medicinal Chemistry. 63 (24), 15494-15507 (2019).
  4. Li, Q. Application of fragment-based drug discovery to versatile targets. Frontiers in Molecular Biosciences. 7, 180 (2020).
  5. Kirsch, P., Hartman, A. M., Hirsch, A. K. H., Empting, M. Concepts and core principles of fragment-based drug design. Molecules. 24 (23), 4309 (2019).
  6. Patel, D., Bauman, J. D., Arnold, E. Advantages of crystallographic fragment screening: functional and mechanistic insights from a powerful platform for efficient drug discovery. Progress in Biophysics and Molecular Biology. 116 (2-3), 92-100 (2014).
  7. Wasserman, S., et al. Automated synchrotron crystallography for drug discovery: the LRL-CAT beamline at the APS. Acta Crystallographica Section A Foundations of Crystallography. 67 (1), 46-47 (2011).
  8. Hartshorn, M. J. Fragment-based lead discovery using X-ray crystallography. Journal of Medicinal Chemistry. 48 (2), 403-413 (2005).
  9. Arzt, S., et al. Automation of macromolecular crystallography beamlines. Progress in Biophysics and Molecular Biology. 89 (2), 124-152 (2005).
  10. Beteva, A. High-throughput sample handling and data collection at synchrotrons: Embedding the ESRF into the high-throughput gene-to-structure pipeline. Acta Crystallographica Section D, Biological Crystallography. 62, 1162-1169 (2006).
  11. Papp, G., et al. FlexED8: The first member of a fast and flexible sample-changer family for macromolecular crystallography. Acta Crystallographica. Section D, Structural Biology. 73, 841-851 (2017).
  12. Casanas, A., et al. EIGER detector: Application in macromolecular crystallography. Acta Crystallographica Section D, Structural Biology. 72, 1036-1048 (2016).
  13. Henrich, B., et al. PILATUS: A single photon counting pixel detector for X-ray applications. Nuclear Instruments and Methods in Physics Research, Section A: Accelerators, Spectrometers, Detectors and Associated Equipment. 607 (1), 247-249 (2009).
  14. Winter, G., Lobley, C. M. C., Prince, S. M. Decision making in xia2. Acta Crystallographica Section D, Biological Crystallography. 69, 1260-1273 (2013).
  15. Winter, G., McAuley, K. E. Automated data collection for macromolecular crystallography. Methods. 55 (1), 81-93 (2011).
  16. Winter, G., et al. DIALS: Implementation and evaluation of a new integration package. Acta Crystallographica Section D, Structural Biology. 74, 85-97 (2018).
  17. Bowler, M. W. MASSIF-1: A beamline dedicated to the fully automatic characterization and data collection from crystals of biological macromolecules. Journal of Synchrotron Radiation. 22 (6), 1540-1547 (2015).
  18. Von Stetten, D., et al. ID30A-3 (MASSIF-3) – A beamline for macromolecular crystallography at the ESRF with a small intense beam. Journal of Synchrotron Radiation. 27, 844-851 (2020).
  19. Cipriani, F., et al. CrystalDirect: a new method for automated crystal harvesting based on laser-induced photoablation of thin films. Acta Crystallographica. Section D, Biological Crystallography. 68, 1393-1399 (2012).
  20. . Helmholtz Zentrum Berlin Available from: https://www.helmholtzberlin.de/forschung/oe/np/gmx/fragment-screening/index_en.html (2021)
  21. Lima, G. M. A., et al. FragMAX: the fragment-screening platform at the MAX IV Laboratory. Acta crystallographica. Section D, Structural biology. 76 (8), 771-777 (2020).
  22. Ng, J. T., Dekker, C., Kroemer, M., Osborne, M., Von Delft, F. Using textons to rank crystallization droplets by the likely presence of crystals. Acta Crystallographica. Section D, Biological Crystallography. 70, 2702-2718 (2014).
  23. Collins, P. M., et al. Gentle, fast and effective crystal soaking by acoustic dispensing. Acta Crystallographica. Section D, Structural Biology. 73, 246-255 (2017).
  24. Wright, N. D., et al. The low-cost Shifter microscope stage transforms the speed and robustness of protein crystal harvesting. Acta Crystallographica. Section D, Structural Biology. 77, 62-74 (2021).
  25. Krojer, T., et al. The XChemExplorer graphical workflow tool for routine or large-scale protein-ligand structure determination. Acta Crystallographica. Section D, Structural Biology. 73, 267-278 (2017).
  26. Pearce, N. M., et al. A multi-crystal method for extracting obscured crystallographic states from conventionally uninterpretable electron density. Nature Communications. 8, 15123 (2017).
  27. . Fragalysis Available from: https://fragalysis.diamond.ac.uk (2021)
  28. . Diamond Light Source Ltd Available from: https://www.diamond.ac.uk/Instruments/Mx/Fragment-Screening.html (2021)
  29. Cox, O. B., et al. A poised fragment library enables rapid synthetic expansion yielding the first reported inhibitors of PHIP(2), an atypical bromodomain. Chemical Science. 7 (3), 2322-2330 (2016).
  30. Vonrhein, C., et al. Data processing and analysis with the autoPROC toolbox. Acta Crystallographica. Section D, Biological Crystallography. 67, 293-302 (2011).
  31. Vonrhein, C., et al. Advances in automated data analysis and processing within autoPROC , combined with improved characterisation, mitigation and visualisation of the anisotropy of diffraction limits using STARANISO. Acta Crystallographica Section A: Foundations and Advances. 74 (1), 360 (2018).
  32. Pearce, N. M., Krojer, T., Von Delft, F. Proper modelling of ligand binding requires an ensemble of bound and unbound states. Acta Crystallographica. Section D, Structural Biology. 73, 265-266 (2017).
  33. Collins, P. M., et al. Achieving a good crystal system for crystallographic x-ray fragment screening. Methods in Enzymology. 610, 251-264 (2018).
  34. Delageniere, S., et al. ISPyB: an information management system for synchrotron macromolecular crystallography. Bioinformatics. 27 (22), 3186-3192 (2011).
  35. Fisher, S. J., Levik, K. E., Williams, M. A., Ashton, A. W., McAuley, K. E. SynchWeb: a modern interface for ISPyB. Journal of Applied Crystallography. 48, 927-932 (2015).
  36. Ginn, H. M., et al. SynchLink: an iOS app for ISPyB. Journal of Applied Crystallography. 47, 1781-1783 (2014).
  37. . Diamond Light Source Ltd Available from: https://www.diamond.ac.uk/Instruments/Mx/Common/Common-Manual/Data-Analysis/Reprocessing-in-ISPyB.html (2021)
  38. Wojdyr, M., Keegan, R., Winter, G., Ashton, A. DIMPLE – a pipeline for the rapid generation of difference maps from protein crystals with putatively bound ligands. Acta Crystallographica. Section A, Foundations of Crystallography. 69, 299 (2013).
  39. Long, F., et al. AceDRG: A stereochemical description generator for ligands. Acta Crystallographica. Section D, Structural Biology. 73, 112-122 (2017).
  40. Moriarty, N. W., Grosse-Kunstleve, R. W., Adams, P. D. Electronic ligand builder and optimization workbench (eLBOW): A tool for ligand coordinate and restraint generation. Acta Crystallographica. Section D, Biological Crystallography. 65, 1074-1080 (2009).
  41. Emsley, P., Lohkamp, B., Scott, W. G., Cowtan, K. Features and development of Coot. Acta Crystallographica. Section D, Biological Crystallography. 66, 486-501 (2010).
  42. Murshudov, G. N., Vagin, A. A., Dodson, E. J. Refinement of macromolecular structures by the maximum-likelihood method. Acta Crystallographica. Section D, Biological Crystallography. 53, 240-255 (1997).
  43. Bricogne, G., et al. Buster version 2.10.3. Global Phasing Ltd. , (2017).
  44. Chen, V. B., et al. MolProbity: All-atom structure validation for macromolecular crystallography. Acta Crystallographica. Section D, Biological Crystallography. 66, 12-21 (2010).
  45. Bruno, I. J., et al. Retrieval of crystallographically-derived molecular geometry information. Journal of Chemical Information and Computer Sciences. 44 (6), 2133-2144 (2004).
  46. Delbart, F., et al. An allosteric binding site of the α7 nicotinic acetylcholine receptor revealed in a humanized acetylcholine-binding protein. TheJournal of Biological Chemistry. 293, 2534-2545 (2018).
  47. Douangamath, A., et al. Crystallographic and electrophilic fragment screening of the SARS-CoV-2 main protease. Nature Communications. 11 (1), 5047 (2020).
  48. Guo, J., et al. In crystallo-screening for discovery of human norovirus 3C-like protease inhibitors. Journal of Structural Biology: X. 4, 100031 (2020).
  49. Keedy, D. A., et al. An expanded allosteric network in PTP1B by multitemperature crystallography, fragment screening, and covalent tethering. eLife. 7, 36307 (2018).
  50. McIntyre, P. J., et al. Characterization of three druggable hot-spots in the aurora-a/tpx2 interaction using biochemical, biophysical, and fragment-based approaches. ACS Chemical Biology. 12 (11), 2906-2914 (2017).
  51. Thomas, S. E., et al. Structure-guided fragmentbased drug discovery at the synchrotron: Screening binding sites and correlations with hotspot mapping. Philosophical Transactions. Series A, Mathematical, Physical and Engineering Sciences. 377 (2147), 20180422 (2019).
  52. Nichols, C., et al. Mining the PDB for tractable cases where x-ray crystallography combined with fragment screens can be used to systematically design protein-protein inhibitors: Two test cases illustrated by IL1β-IL1R and p38α-TAB1 complexes. Journal of Medicinal Chemistry. 63 (14), 7559-7568 (2020).
  53. D’Arcy, A., Bergfors, T., Cowan-Jacob, S. W., Marsh, M. Microseed matrix screening for optimization in protein crystallization: What have we learned. Acta Crystallographica. Section F, Structural Biology Communications. 70, 1117-1126 (2014).
  54. Wollenhaupt, J., et al. F2X-Universal and F2X-Entry: Structurally diverse compound libraries for crystallographic fragment screening. Structure. 28 (6), 694-706 (2020).
  55. . Zenodo Available from: https://zenodo.org (2021)
  56. Foley, D. J., et al. Synthesis and demonstration of the biological relevance of sp(3) -rich scaffolds distantly related to natural product frameworks. Chemistry. 23 (60), 15227-15232 (2017).
  57. Kidd, S. L., et al. Demonstration of the utility of DOS-derived fragment libraries for rapid hit derivatisation in a multidirectional fashion. Chemical Science. 11 (39), 10792-10801 (2020).
  58. . EU-openscreen ERIC Available from: https://www.eu-openscreen.eu/ (2021)
  59. Schuller, M., et al. Fragment binding to the Nsp3 macrodomain of SARS-CoV-2 identified through crystallographic screening and computational docking. bioRxiv. 393405, (2020).

Play Video

Cite This Article
Douangamath, A., Powell, A., Fearon, D., Collins, P. M., Talon, R., Krojer, T., Skyner, R., Brandao-Neto, J., Dunnett, L., Dias, A., Aimon, A., Pearce, N. M., Wild, C., Gorrie-Stone, T., von Delft, F. Achieving Efficient Fragment Screening at XChem Facility at Diamond Light Source. J. Vis. Exp. (171), e62414, doi:10.3791/62414 (2021).

View Video