本研究は、薬物とペプチドの相互作用を同定するための戦略を提示することを目的とした。この戦略は、水晶結晶マイクロバランス(QCM)バイオセンサーに基づく薬物認識短いペプチドのバイオパンニングを含み、続いてタンパク質上の薬物認識および薬物結合部位の注釈のために得られた情報を定量的に評価するためのバイオインフォマティクス分析を行う。
受容体と酵素タンパク質は、生体活性低分子の結合標的として作用する重要な生体分子です。したがって、薬物とタンパク質相互作用の迅速かつグローバルな検証は、治療効果の根底にある分子メカニズムを理解するだけでなく、臨床用の吸着、分布、代謝、排泄、毒性(ADMET)などの薬物特性を評価するためにも非常に望ましい。ここでは、ファージキャプシド上に容易に表示できるT7ファージ表示短いペプチドのバイオパニングに対するバイオセンサーベースの高スループット戦略を提示する。その後の、短いセグメントを含むペプチドのアミノ酸配列の解析は、「壊れた遺物」として、受容体リガンド接触(RELIC)群におけるバイオインフォマティクスプログラムを用いた薬物結合部位の、また示されている。この方法を、抗腫瘍イリノテカンと抗インフルエンザオセルタミビルの2つの臨床的に承認された薬物に適用することにより、薬物認識ペプチド配列を収集し、標的タンパク質の薬物結合部位を強調するための詳細なプロセスを本論文で説明する。本明細書に記載されている戦略は、関心のある任意の小分子に適用することができる。
薬物結合標的の同定は、疾患の分子メカニズムを理解する上で、薬物の開発に不可欠である。特に、受容体および酵素タンパク質は、生体活性小分子1の最も重要な分子標的である。アフィニティーキャプチャは、薬物結合タンパク質2を同定するための十分に確立された技術であるが、タンパク質の低溶解性などの技術的な制限は、しばしば薬物標的2の検証を妨げる。最も重要なことは、固定化された小分子は、ドッキングに必要な自由度を失い、より大きな標的タンパク質上の内部に位置する結合部位にアクセスできないことである。さらに、タンパク質のミスフォールディング、共結晶化条件の解析不能、分子サイズによる制限が、しばしばX線結晶学の使用を妨げる、核磁気共鳴(NMR)、および薬物タンパク質相互作用を研究するための実験分析を妨げる。
T7ファージディスプレイバイオパンニングの使用は、小分子餌3のタンパク質上の結合部位を決定するための効率的な方法である。特に、合成DNAをマルチクローニング部位に挿入して構築できるT7ファージ表示ランダムペプチドライブラリーが有効である。T7ファージライブラリー表示タンパク質と比較して、短いペプチドは、物理的な制限なしにT7ファージキャプシドに表示されるように容易に設計することができ、固体支持体2上に固定された任意の低分子薬物との滅体的接触が可能である。さらに、T7ファージディスプレイバイオパニングプラットフォームへの水晶結晶マイクロバランス(QCM)バイオセンサの導入により、QCM周波数4,5の減少をモニタリングすることにより、短いペプチドと薬物の弱い特異的な相互作用を同定することができる。結合したT7ファージは、次いで宿主の大腸菌(BLT5615)に感染して直接回収され、アフィニティー選択ペプチドをコードする領域のDNA配列は薬物認識短いセグメントを含む。ペプチド集団のアミノ酸配列のその後の分析は、薬物認識に関する情報を提供する。救出されたアミノ酸配列のインシリコ対アライメントでは、選択したプロテオーム内の薬物の生物学的標的に関する情報を得るために使用することができる。この高スループットの薬物に対する親和性を有するタンパク質断片の同定は、陶器シャード6から古代のアーティファクトを再構築することと同様の方法で薬物結合部位をヒューリスティックに再構築するために使用することができる。特に、このユニークなアプローチは、従来のプロテオミクスアプローチが失敗したときに役立ちます。
ここでは、小分子の標的検証のためのT7ファージ表示ペプチドのバイオパニングおよびバイオインフォマティクス解析のためのバイオセンサーベースの戦略を提示する。従来の方法の技術的な制限を超えて、この戦略は、同一のプロトコルの下で関心のある任意の小分子の標的タンパク質上の薬物結合部位の同定を可能にする。
ここでは、薬物認識ペプチドのQCMバイオセンサーベースバイオパンニングの戦略、続いて、同定されたペプチドを用いた薬物とタンパク質相互作用を検証するためのバイオインフォマティクス分析が提示されている。バイオセンサの金電極上で固定化するための小分子誘導体の設計は重要なステップであり、導入リンカーとしては薬物を認識するペプチドの結合および収集を妨げる可能性がある。これを避けるために、導入されたリンカーの異なる位置を持つ誘導体は23.あるいは、疎水性の小分子を固定化するために、センサチップを10cmのペトリ皿にバルク水に浸漬し、低分子の20μL溶液(ジメチルスルホキシド中の10mM溶液)をバイオセンサの金極に落とし、その表面を覆い、5分間インキュベートする。これは、バイオパンニング中に少なくとも10分間保持される小分子のサブ百ヘルツ固有の周波数の保持を可能にする。実際、このような固定化を用いて、オセル親和性選択ペプチドはNAにおけるオセル結合部位を明確に強調した(図3)。
ここでペプチドライブラリーを調製するために使用されるT7ファージは、20個の標準アミノ酸の全てについて32コドンをコードし、2ストップコドン(UAA,UGA)の出現を抑制するNNK15カセットを用いて遺伝子操作され、UAG(図1)6、7のみを出現させる。これは、15-merの全長ペプチドを表示し、ライブラリの多様性を高めるには重要です。T7ファージディスプレイシステムは107-109 T7ファージの技術的な表示限界を有する。しかし、15-merペプチドライブラリーの多様性は理論的には20 15(3.27×1019)である。したがって、ライブラリの完全な構築には使用できません。それにもかかわらず、類似性検索または保存モチーフの採掘は、ライブラリー内のこの限られた多様性のペプチドであっても、タンパク質の薬物結合部位を含むアミノ酸の検出を可能にする。さらに、ライブラリーペプチド内での3—5アミノ酸ストレッチ(T7ファージディスプレイシステムを使用して実現できる1/203と1/205の間の出現率)は、小分子薬物の認識に関与している。したがって、標的タンパク質の薬物結合部位を構成する15-merアミノ酸配列を有するペプチド配列の100%一致は必要ない。実際、約30個のアフィニティー選択ペプチドが、試験した各薬剤に対する標的タンパク質の結合部位を強調した(図4)。これにより、使用される親T7ファージライブラリ(1.7×107 pfu/mL)の多様性を、薬物結合部位をヒューリスティックに再構成するために使用することができる。
典型的には、薬物認識アミノ酸ストレッチを含む15-merアミノ酸配列と同じ配列を示すT7ファージの3-5コピーが任意に単離された16プラーク内に出現し、我々のプロトコルの下で親和性選択の成功を示す。これは、18-30種類の薬物認識ペプチド配列が単離された96プラーク内で収集されることを示し(その数はマイクロプレート形式に関連付けられている)、DNAのシーケンシングを使用して後で同定され、対応するアミノ酸配列を得る。本戦略では、8 mLバッファーを含むキュベットへのT7ファージライブラリーの8μLの注入(ライブラリーの1000倍希釈)は、T7ファージの非特異的結合を低減するのに適している。アフィニティ選択ペプチドの多様性を高めるために、1サイクルの選択を数回繰り返し、スクリーニングごとに16または32プラークの単離を使用することは、一度に単一の溶液からの単一の単一の単一の単一の分離よりも効果的であることが判明した。例えば、約30種類の異なる配列の親和性選択ペプチドを効果的に収集するために、3-6組の1サイクル選択を行い、各実験で16または32のプラークを単離した。全16または32T7ファージのプラークの同一の配列の出現は、背景の偶発的な検出を示すか、または持ち越しとして汚染する可能性がある。対照的に、15-merの長さよりも短いペプチドを有する多くのT7ファージの同じ配列または出現を有するT7ファージの不在は、集団中のT7ファージが非特異的に高い確率で出現したことを示している。QCMの周波数低減は、このような場合でも同じ程度に起こるので、選択の成功は、単離されたT7ファージのDNAをシーケンシングすることによって包括的に評価されるべきであり、続いてペプチドのアミノ酸配列のバイオインフォマティクス分析を行う。さらに、従来のT7ファージ表示プロトコルとは異なり、繰り返し選択のラウンドは効果が低く、T7ファージの変動および数が小さく、増幅および選択ステップ23を繰り返した後も濃縮されない。
重要なことに、この方法は、ヒトのプロテオーム、病原性ウイルス、さらには植物のタンパク質中の低分子結合部位の採掘に適用可能である。興味深いことに、T7ファージキャプシド上のペプチドのおそらく非構造化短い表示長は、小分子とのドッキング中にタンパク質のペプチドの分子動力学を模倣することができます。これは、動的バインディング24を反映できます。従来の方法の技術的な制限を超えて、この戦略は、小分子のための同一のプロトコルに適用可能であり、薬物とタンパク質相互作用分析に関するより粒度を提供するだけでなく、薬物可能なプロテオームを拡大する可能性があります。
このアプローチの技術的な制限事項を考慮する必要があります。バイオセンサチップの金電極表面に低分子固定化を行う場合には有機合成が必要です。有機化学の非専門家のために、いくつかの固定化試薬は、機械的に結合によって小分子を固定するために市販されている。さらに、ペプチドの特定のナンセンス部分は、偽陽性として薬物ドッキングに関係しないタンパク質の一部の検出をもたらす可能性があります。これは、T7ファージのコピーが生成される場合、他の標準的なアミノ酸よりも多くのコドンによってコードされるロイシンまたはバリン残基が豊富なβシートまたはロイシンが豊富なドメインに経験的に対応する。ライブラリーペプチド長を制御すると、偽陽性の発生を制御する可能性があります。これに対し、X線結晶学やNMR解析を用いて実証されているように、ドッキングに関与する薬物結合部位のアミノ酸残基が検出されない場合がある。これは、より多くの薬物認識ペプチドを収集するか、または金電極上の小分子の固定方向を変更することによって解決することができる。
薬物使用の主な効果と二次的な効果に関連する多くの薬物とタンパク質の相互作用は、プロテオーム内で未確認である可能性があります。さらに、薬物吸収、分布、代謝、排泄、毒性を担う酵素およびトランスポーターも未確認である可能性があります。タンパク質結合は、薬物の生物活性に対して必ずしも責任を負わない。したがって、生物学的アッセイからの他の情報の組み合わせは、薬物の主および有害な影響を担う必須薬物標的の同定を改善する。この簡潔な技術のさらなる適応は、低分子薬物の広い範囲のタンパク結合部位の採掘のための実用性およびスループットを増加させる。本明細書に提示される方法は、関連分野における基礎研究を行うだけでなく、臨床使用における薬物の治療効果やその他の生物学的効果の根底にある分子メカニズムを明らかにすることに大きく貢献する。
The authors have nothing to disclose.
著者は、オセルタミビルを提供してくれた林裕次郎博士と石川勇人博士、独立したRELICプログラムを提供してくれたイ・マコフスキ博士に感謝します。また、QCM実験の技術支援に関する川越哲也氏を認める。この作業は、JSPS KAKENHIグラント番号17K01363(Y.T.)によって部分的にサポートされました。
データ可用性ステートメント
本論文で用いられているプロテオームデータベースからのタンパク質配列と同様に、薬物に対するアフィニティー選択ペプチドの独立型RELICプログラムおよび配列データは、本著者から依頼(tkksg@rs.noda.tus.ac.jp)入手可能である。
AFFINIXQN | ULVAC, Inc. (Tokyo, Japan) | QCM2008-STKIT | Contains Glass cuvette, stir magnet, operation and analysis software with a Windows PC |
AADIV | Northeastern University (Lee Makowski) |
AADIV.exe | Calculates the frequency of occurrence of each of the 20 amino acids at each recombinant insert position, as well as the overall position-independent frequency of each amino acid within that set of peptide sequences. Also roughly estimates the sequence diversity of a display library by statistical sampling method based upon sequences obtained from a limited number of randomly sampled members of the library. |
Ceramic Sensor Chip | ULVAC, Inc. (Tokyo, Japan) | QCMST27C | 4 sensor chips/package |
Dimethyl sulfoxide | Sigma-Aldrich (St. Louis, MO, USA) |
D8418 | |
Ethanol | Merck (Kenilworth, NJ, USA) | 09-0850 | |
FASTAcon | Northeastern University (Lee Makowski) |
FASTAcon.exe | Identifies proteins from a population with short consensus sequences. |
FASTAskan | Northeastern University (Lee Makowski) |
FASTAskan.exe | Lists proteins with high similarity to a peptide population. |
Immiblization kit for AFFINIX | ULVAC, Inc. (Tokyo, Japan) | QCMIMKT | SAM reagent and amine coupling reagent |
INFO | Northeastern University (Lee Makowski) |
INFO.exe | Provides mathematical measure of the probability of observing a particular peptide sequence by random chance (i.e., nonspecific binding) as opposed to by selection for a specific property (affinity to small molecule). |
Liguid LB medium | Sigma-Aldrich (St. Louis, MO, USA) |
L3522 | Autoclave for 20 min |
MATCH | Northeastern University (Lee Makowski) |
MATCH.exe | Identifies any stretches of amino acid residues within a particular protein that exhibit significant similarity to a group of affinity-selected peptides. Outputs as cluster dia- gram and cumulative similarity plot calculated from a modified BLOSUM62 matrix with a short window (5–6 amino acids in length). |
MOTIF1 | Northeastern University (Lee Makowski) |
MOTIF1.exe | Searches for three continuous amino acid sequence motifs within a peptide population. |
MOTIF2 | Northeastern University (Lee Makowski) |
MOTIF2.exe | Searches for patterns of three amino acids and does not allow conservative amino acid substitutions, but does allow identical gap lengths. |
NaCl | Merck (Kenilworth, NJ, USA) | S3014 | |
Recptor ligand contacts (RELIC) | Argonne National Laboratory (Lemont, IL, USA) |
https://www.relic.anl.gov | Currently unavailable (Stand-alone program can be used from correspondence author upon request) |
Tris | Merck (Kenilworth, NJ, USA) | 252859 |