L’obiettivo di questo protocollo è quello di delineare la progettazione e le prestazioni degli esperimenti in vivo nella Drosophila melanogaster per valutare le conseguenze funzionali delle varianti genetiche rare associate alle malattie umane.
I progressi nella tecnologia di sequenziamento hanno reso i set di dati dell’intero genoma e dell’intero esoma più accessibili sia per la diagnosi clinica che per la ricerca sulla genetica umana all’avanguardia. Sebbene siano stati sviluppati diversi algoritmi in silico per prevedere la patogenicità delle varianti identificate in questi set di dati, gli studi funzionali sono fondamentali per determinare come specifiche varianti genomiche influiscono sulla funzione delle proteine, in particolare per un errore Varianti. Nella rete di ricerca sulle malattie non diagnosticate (UDN) e in altri consorzi di ricerca sulle malattie rare, gli organismi modello (MO) tra cui la Drosophila, i c. elegans, ipesci zebra e i topi sono utilizzati attivamente per valutare la funzione di malattia umana putativa che causa Varianti. Questo protocollo descrive un metodo per la valutazione funzionale delle varianti umane rare utilizzate nel Centro di screening degli organismi modello Drosophila Core dell’UDN. Il flusso di lavoro inizia con la raccolta di informazioni umane e MO da più database pubblici, utilizzando la risorsa web MARRVEL per valutare se la variante potrebbe contribuire alle condizioni di un paziente e progettare esperimenti efficaci basati su quelli disponibili conoscenze e risorse. Successivamente, vengono generati strumenti genetici (ad esempio, linee CDNA T2A-GAL4 e UAS-umani) per valutare le funzioni delle varianti di interesse per la Drosophila. Dopo lo sviluppo di questi reagenti, è possibile eseguire analisi funzionali su due punte basate su esperimenti di salvataggio e sovraespressione per valutare la funzione di variante. Nel ramo del salvataggio, i geni della mosca endogena vengono “umanizzati” sostituendo il gene ortologo della Drosophila con transgeni umani di riferimento o variante. Nel ramo della sovraespressione, le proteine umane di riferimento e variante sono esogenamente guidate in una varietà di tessuti. In entrambi i casi, qualsiasi fenotipo setabile (ad esempio, letalità, morfologia degli occhi, elettrofisiologia) può essere utilizzato come lettura, indipendentemente dalla malattia di interesse. Le differenze osservate tra gli alleli di riferimento e varianti suggeriscono un effetto specifico della variante, e quindi probabilmente patogenicità. Questo protocollo consente valutazioni rapide e in vivo delle varianti putative che causano malattie umane di geni con funzioni note e sconosciute.
I pazienti con malattie rare spesso subiscono un viaggio arduo indicato come “odissea diagnostica” per ottenere una diagnosi accurata1. Si ritiene che la maggior parte delle malattie rare abbia una forte origine genetica, rendendo critici gli elementi critici dell’elaborazione genetica/genomica dell’elaborazione clinica. Oltre all’analisi delle variazioni dei pannelli genici e dei numeri di copie candidati, oltre all’analisi delle variazioni dei numeri cromosomici, all’intero esoma (WES) e al sequenziamento dell’intero genoma sono diventati strumenti sempre più preziosi nell’ultimo decennio2, 3. Attualmente, il tasso diagnostico per identificare una variante patogena nota in WES e WGS è di 25% (superiore nei casi pediatrici)4,5. Per la maggior parte dei casi che rimangono non diagnosticati dopo WES/WGS clinici, un problema comune è che ci sono molti geni e varianti candidati. Il sequenziamento di nuova generazione spesso identifica varianti nuove o ultrarare in molti geni e interpretare se queste varianti contribuiscono ai fenotipi della malattia è difficile. Ad esempio, anche se la maggior parte delle mutazioni senza senso o frameshift nei geni sono ritenute come alleli di perdita di funzione (LOF) a causa del decadimento mediato da sciocchezze della trascrizione codificata, mutazioni troncanti trovate negli ultimi esoni sfuggono a questo processo e possono funzionare come benigni o gain-of-function (GOF) alleli6.
Inoltre, prevedere gli effetti di un allele missense è un compito scoraggiante, dal momento che può portare a una serie di diversi scenari genetici come descritto per la prima volta da Herman Muller negli anni ’30 (cioè amorfi, ipomorfi, ipomorfi, antimorfi, antimorfi, neomorfi o isomorfi)7 . Numerosi programmi e metodologie in silico sono stati sviluppati per prevedere la patogenicità delle varianti missense basate sulla conservazione evolutiva, il tipo di cambiamento degli amminoacidi, la posizione all’interno di un dominio funzionale, la frequenza allele nella popolazione generale, e altri parametri8. Tuttavia, questi programmi non sono una soluzione completa per risolvere il complicato problema dell’interpretazione delle varianti. È interessante notare che, un recente studio ha dimostrato che cinque algoritmi di previsione della patogenicità variante ampiamente utilizzati (Polyphen9, SIFT10, CADD11, PROVEAN12, Mutation Taster) concordano sulla patogenicità 80% delle volte8 . In particolare, anche quando tutti gli algoritmi sono d’accordo, restituiscono una previsione errata della patogenicità fino all’11% del tempo. Questo non solo porta a un’interpretazione clinica imperfetta, ma può anche dissuadere i ricercatori dal seguire le nuove varianti elencandole falsamente come benigne. Un modo per completare l’attuale limitazione della modellazione in silico consiste nel fornire dati sperimentali che dimostrino l’effetto della funzione variant in vitro, ex vivo (ad esempio, cellule coltivate, organoidi) o in vivo.
Gli studi funzionali in vivo sulle varianti associate alle malattie rare nel MO hanno punti di forza unici13 e sono stati adottati da molte iniziative di ricerca sulle malattie rare in tutto il mondo, tra cui la Rete delle Malattie Non Diagnosi (UDN) negli Stati Uniti e Rara Malattie Modelli & Meccanismi (RDMM) Reti in Canada, Giappone, Europa e Australia14. Oltre a questi sforzi coordinati per integrare i ricercatori MO nel flusso di lavoro della diagnosi di malattie rare e degli studi meccanicistici su scala nazionale, una serie di studi di collaborazione individuale tra ricercatori clinici e MO hanno portato alla scoperta e caratterizzazione di molti nuovi geni e varianti che causano malattie umane82,83,84.
Nell’UDN, un Centro di screening centralizzato degli organismi modello (MOSC) riceve la presentazione di geni e varianti candidati con una descrizione delle condizioni del paziente e valuta se la variante è probabilmente patogena utilizzando strumenti informatici e in vivo Esperimenti. Nella Fase I (2015-2018) dell’UDN, il MOSC comprendeva un Drosophila Core [Baylor College of Medicine (BCM)] e il nucleo di pesce zebra (Università dell’Oregon) che ha lavorato in collaborazione per valutare i casi. Utilizzando l’analisi informatica e una serie di diverse strategie sperimentali in Drosophila e pesce zebra, il MOSC ha finora contribuito alla diagnosi di 132 pazienti, l’identificazione di 31 nuove sindromi55, scoperta di diversi nuovi i geni della malattia (ad esempio, EBF315, ATP5F1D16, TBX217, IRF2BPL18, COG419, WDR3720) e l’espansione fenotipica della malattia nota (ad esempio, CACNA1A21, ACOX122).
Oltre ai progetti all’interno dell’UDN, i ricercatori del MOSC Drosophila Core hanno contribuito a nuove scoperte geniche della malattia in collaborazione con i Centers for Mendelian Genomics e altre iniziative (ad esempio, ANKLE223, TM2D3 24 , NRD125, OGDHL25, ATAD3A26, ARIH127, MARK328, DNMBP29) utilizzando lo stesso insieme di informatica e genetica strategie sviluppate per l’UDN. Dato il significato degli studi di MO sulla diagnosi di malattia rara, il MOSC è stato ampliato per includere un C. elegans Core e un secondo nucleo di pesce zebra (entrambi alla Washington University di St. Louis) per la fase II (2018-2022) dell’UDN.
Questo manoscritto descrive un protocollo di studio funzionale in vivo che viene utilizzato attivamente nel nucleo di Drosophila UDN MOSC per determinare se le varianti missense hanno conseguenze funzionali sulla proteina di interesse utilizzando mosche transgeniche che esprimono l’uomo Proteine. L’obiettivo di questo protocollo è quello di aiutare i ricercatori MO a lavorare in collaborazione con gruppi di ricerca clinica per fornire prove sperimentali che una variante candidata in un gene di interesse ha conseguenze funzionali, facilitando così la diagnosi clinica. Questo protocollo è particolarmente utile in uno scenario in cui un ricercatore della Drosophila viene avvicinato da un ricercatore clinico che ha un paziente a malattia rara con una variante candidata specifica in un gene di interesse.
Questo protocollo può essere suddiviso in tre elementi: (1) raccogliere informazioni per valutare la probabilità che la variante di interesse sia responsabile del fenotipo del paziente e la fattibilità di uno studio funzionale in Drosophila, (2) raccolta strumenti genetici esistenti e stabilirne di nuovi, e (3) svolgere studi funzionali in vivo. Il terzo elemento può essere ulteriormente suddiviso in due sottoelementi in base al modo in cui può essere valutata la funzione di una variante di interesse (esperimento di salvataggio o strategie basate su sovraespressioni). È importante notare che questo protocollo può essere adattato e ottimizzato a molti scenari al di fuori della ricerca sulle malattie monogeniche rare (ad esempio, malattie comuni, interazioni genetico-ambiente e schermi farmacologici/genetici per identificare gli obiettivi terapeutici). La capacità di determinare la funzionalità e la patogenicità delle varianti non solo gioverà al paziente di interesse fornendo una diagnosi molecolare accurata, ma avrà anche un impatto più ampio sulla ricerca scientifica traslazionale e di base.
Studi sperimentali che utilizzano la Drosophila melanogaster forniscono un robusto sistema di analisi per valutare le conseguenze delle varianti umane associate alla malattia. Ciò è dovuto al grande corpus di conoscenze e ai diversi strumenti genetici che sono stati generati da molti ricercatori nel campo del volo nel corso dell’ultimo secolo89. Proprio come qualsiasi altro sistema sperimentale, tuttavia, è importante riconoscere le avvertenze e le limitazioni che esistono.
<p clas…The authors have nothing to disclose.
Ringraziamo Jose Salazar, Julia Wang e la dottoressa Karen Schulze per la lettura critica del manoscritto. Riconosciamo i dottori Ning Liu e Xi Luo per la caratterizzazione funzionale delle varianti TBX2 discusse qui. Undiagnosed Diseases Network Model Screening Center è stato supportato attraverso il National Institutes of Health (NIH) Common Fund (U54 NS093793). H. T. C. è stato inoltre sostenuto dal NIH[CNCDP-K12 and NINDS (1K12 NS098482)], dall’American Academy of Neurology (Neuroscience Research grant), dal Burroughs Wellcome Fund (Career Award for Medical Scientists), dalla Child Neurology Society and Child Neurology Foundation ( PERF Elterman) e il NIH Director’s Early Independence Award (DP5 OD026426). M. F. W. è stato inoltre sostenuto dalla Simons Foundation (Premio SFARI: 368479). S. Y. è stato inoltre sostenuto dalla NIH (R01 DC014932), dalla Simons Foundation (Premio SFARI: 368479), dall’Alzheimer(New Investigator Research Grant: 15-364099), dal Naman Family Fund for Basic Research e dal Caroline Wiess Law Fund for Research in Medicina molecolare. La microscopia confocale al BCM è supportata in parte da NIH Grant U54HD083092 al Nucleo di Neurovisualizzazione dell’Intellectual and Developmental Disabilities Research Center (IDDRC).
Drosophila Stocks for UAS-human cDNA transgenesis | |||
Injection strains for transgenesis (D. melanogaster) | BDSC | #24871 | Specific Reagent: VK33 (3rd chromosome) Injection line |
Injection strains for transgenesis (D. melanogaster) | BDSC | #24872 | Specific Reagent: VK37 (2nd chromosome) Injection line |
Plasmid DNA | |||
Cloning vector | Thermo Fisher | #12536-017 | Specific Reagent: pDONR221 |
Drosophila transgenesis vector | Gift from Drs. Johannes Bischof and Konrad Basler (Bischof et al., 2013 PNAS) | Specific Reagent: pGW-HA.attB | |
Molecular biology kits and reagents | |||
Agarose | Sigma-Aldrich | #A2790 | Specific Reagent: Agarose (molecular biology grade) |
Chemically Competent Cells (E. coli) | Thermo Fisher | #18265017 | Specific Reagent: DH5α |
DNA Gel Extraction kit | Thermo Fisher | #K210012 | Specific Reagent: PureLink Gel Extraction Kit |
DNA Isolation and purification kit | Qiagen | #27104 | Specific Reagent: QIAprep Spin Miniprep Kit |
High Fidelity Polymerase | NEB | #M0491 | Specific Reagent: Q5 Polymerase kit |
Recombinase mediated cloning system | Thermo Fisher | #11789020 | Specific Reagent: Gateway BP Clonase kit |
Recombinase mediated cloning system | Thermo Fisher | #11791100 | Specific Reagent: Gateway LR Clonase II Enzyme kit |
Site Directed Mutagenesis kit | Agilent | #200523 | Specific Reagent: Quick Change II Mutagenesis kit |
Electroretinogram Rig related equipment | |||
ERG Analysis | Molecular Devices | N/A | Specific Reagent: Axon pCLAMP 10 Data Software Package |
ERG Data Collection | LabX | #R150358 | Specific Reagent: ISO-DAM Isolated Biologic Amplifier |
ERG Stimulator | Astro-Med | #S48 | Specific Reagent: Square Pulse Stimulator |