Summary

包括的な胸部腫瘍学データベースの世代 - トランスレーショナルリサーチのためのツール

Published: January 22, 2011
doi:

Summary

胸部腫瘍学のデータベースは、トランスレーショナルリサーチの目的のために臨床的および検査データのための包括的なリポジトリとして機能するように開発されました。データベースは、胸部腫瘍学の研究プログラムの中で並進がん研究者が配信されます。このデータベースは、他の癌のモデルだけでなく、他のヒトの疾患に適応可能です。

Abstract

胸部腫瘍学プログラムのデータベースプロジェクトは、包括的な検証、および十分に注釈付きの癌標本及び胸部腫瘍学研究プログラム内の研究者が利用できるようにする臨床データのアクセス可能なリポジトリとして機能するように作成されました。このデータベースには、種々の腫瘍組織の研究から得られたゲノム及びプロテオミクス、大量のデータを取り込みます。臨床と基礎科学の研究者、統計学者、およびバイオインフォマティクスの専門家のチームは、データベースを設計するために召集された。興味のある変数は、明確に定義し、それらの記述は、データの注釈の一貫性を確保するために、標準のオペレーティングマニュアル内に書かれていた。腫瘍と正常組織サンプルは、患者から、将来の組織の銀行と回顧バンキングのための別のプロトコルのプロトコルを用いて収集されたこれらのプロトコルに同意。このような人口統計学、癌の特性、およびこれらの患者の治療計画などの臨床情報を抽象化し、Accessデータベースに入力された。プロテオミクスおよびゲノムデータがデータベースに含まれており、データベース内で説明され患者のための臨床情報にリンクされている。各テーブルからのデータは、データベースマネージャーは、クエリの実行中に臨床的および検査情報を接続できるようにするために、Microsoft Accessでリレーションシップ機能を使用してリンクされていた。照会データは、統計分析と仮説生成のためにエクスポートすることができます。

Protocol

1。大学の臨床研究のプロトコル: 二つの大学のプロトコルは、このイニシアチブの目的のために開発された。最初のプロトコルでは、肺癌、食道癌、カルチノイド腫瘍、胸腺腫、中皮腫の患者からの組織の将来の調達が可能になります。プロトコルはまた、血液やその他体液がバイオマーカー研究のための患者から収集することができます。プロトコルは、グラフの抽象化を介してそのような標本の患者のソースからの臨床情報を入手し、標本と、保護されたデータベースでの臨床データの両方を格納するための研究を可能にします。 第二のプロトコルは、研究者は患者のがんの診断と治療の過程で得られる以前にバンクの組織や他のサンプルへのアクセスを可能にするただし、1番目と似ています。シカゴの大学で手術に同意したとこの議定書に署名した人の患者が対象となります。 2。臨床データ収集プロトコル: 前述の悪性腫瘍の治療のためにシカゴ大学医療センターで見られている患者は、このプロトコルに含まれていました。 適格患者は、その治療腫瘍が同定され、二つのプロトコルで訓練を受けた臨床チームのメンバーによって同意された。 一度、同意患者の病歴の情報は、グラフの抽象化を介して取得され、臨床サポートチームのメンバーによってデータベースに入力されました。 3。検体採取のプロトコル: 組織サンプル生検または手術を介して患者の標準的な臨床ケアの間に得られた、既知または疑われる悪性腫瘍を含む組織は、このプロトコルに含まれていました。患者の診断精密検査のために必要だったものの外には他の組織は、得られなかった。 恒久的なセクションの準備のために必要なサンプルの外科的切除後、残存組織を氷上に置いた。 組織の調達の技術者は、病理学部門に氷上に​​残留サンプルを輸送。 残存組織は、測定されたストレージに転送、ラベル付け、および適切に標準操作手順に従って文書化、秤量した。 標本の長期保存は、病理学部門の-80℃冷凍庫で維持された。 すでに胸部悪性腫瘍の手術を受けた患者から組織サンプルにアクセスするために、外科医と放射線腫瘍医のコラボレーションによって維持される患者のリストが参照されました。このように関心の患者が同定された。同意が得られた場合、その腫瘍組織サンプルは、病理学の部門から取得することができます。 血液サンプル臨床的に中に示されている血液は、さらに5mLのグリーントップ(ヘパリン)チューブ、一つ10mLのパープルトップチューブ(EDTA生殖細胞系列DNA)および1つの10 mLのレッドトップ(血清)チューブに血液の追加の二から六管に許可されるプロトコルを描きます血液の。 まで異なる時点で6サンプルまでは、血液の日付注釈付きの描画で、撮影された。 血液試料を10分間2000rpmで遠心分離した。 血漿と血清成分は​​1mLの部分でクライオバイアルチューブに分注していた。 白血球のコレクションの場合、インタフェース/赤血球の割合の上限1 – 2mLのは、細胞保存媒体の1 – 2mLの(MEM EBSメディア+ 10%ウシ胎児血清CAL + 5%DMSO)に再懸濁した。 すべてのサンプルは70〜80時イソプロピル凍結ボックスに徐々に凍結°で16-24時間のためのCは、-70℃〜-80℃の保管箱に転送。 すべてのサンプルは、バーコード化された一意の識別子で標識し、適切に研究室の技術者によるサンプルの調達のフォームに記載されていた。 他の体液: 臨床使用のために収集されない流体はこのプロトコルの下で収集し、格納できます。痰のサンプルを採取し、細胞診のために送られた。喀痰サンプルは4℃、氷上で保存した° Cが転送されながら。 痰のサンプルを、15mlのファルコンチューブに移し、10分間、1400 rpmで遠心分離した。 上清を6mL cyrovialsに4mLの部分に分注していた。 Cyrovialsは、ドライアイス上で、またはその後-70 ° C〜-80℃に凍結されるイソプロピル凍結ボックスで、冷凍庫に入れ、 16-24時間後、サンプルは-70℃〜-80℃の保管箱に移した。 すべてのサンプルは、バーコード化された一意の識別子で標識し、適切に研究室の技術者によるサンプルの調達のフォームに記載されていた。 4。情報インフラストラクチャの構築: データベース管理プログラムの数を評価した後、Microsoft Accessは上胸部のために家の臨床および実験室データにプログラムに選ばれましたその操作性と関連するデータのセットをリンクする機能に基づいてcologyプログラムのデータベースプロジェクト。 臨床医、基礎科学の研究者、統計学者、およびバイオインフォマティクスの専門家のチームは、データベース内で取得する興味のある変数を識別するために召集された。 チームは、患者情報、がんの特性評価、疫学的要因、及び試料の注釈胸部腫瘍学の研究者のニーズに基づいてと国立がん研究所で共通のデータ要素(CDEを)についての設定基準を参照に関連するデータ要素を同定した。 チームは、研究目的のデータが分析可能にする符号化方式を開発した。可能な場合、データはデータベースに入力された自由なテキストの量を減らすように数値変数を使用してコード化された。 興味のある変数は、関連する情報の多様な側面をキャプチャするために、Microsoft Access内の7つのテーブル間で分割された。 5。各テーブルの内容を設計する。 1)患者テーブル、2)サンプルデータのテーブル、3)TMAテーブル、4)DNA標本テーブル、5)胸部腫瘍学会議テーブル、6)細胞株のテーブル、および7)C.:七つの主要なテーブルが作成されましたエレガンステーブル。 患者テーブルは、患者、その癌、その臨床経過、それらのリスク要因、およびその結果(図1)についての臨床的に関連する情報を格納するデータベース内でのみのテーブルとして設計されました。この特定の設計の意図は、データベース内の冗長性を制限することでした。 それらの患者のソースにサンプルデータテーブルのリンクは、病理標本。各サンプルは、サンプル病理番号を与えられ、この番号は、患者の医療記録番号に関連しています。複数の検体を各個体から得られるので、この表には、試料が得られた日付と採取された検体の種類に関する情報が含まれる場合があります。最初の腫瘍、再発腫瘍、または剖検標本を。 TMAのテーブルは、63のユニークな蛋白質の蛋白質の発現データをキャプチャするためにこれまで使用されています。 TMAは、蛋白質(図2)をローカライズする抗体を用いて腫瘍と非腫瘍組織で発現の異なるタンパク質の分布を特徴づけるために使用することができます。タンパク質発現は、TMAの染色の強さと割合の病理学者の印象に基づいて、0、1、2、または3のスコアで表されます。 パーセントの染色を測定する場合、0のスコアがない染色がないことを示し、1は、以下の11%の染色を示し、2は50%未満の染色を示し、3は50%以上の染色を示している。強度を測定する場合、スコアは0〜3の規模で、染色の相対量に基づいて割り当てられます。いくつかのケースでは、IHCスライドも高解像度でスキャンされ、染色強度は、病理学者のスコアリングに平行に自動化された細胞イメージングシステム(ACIS)イメージングソフトウェアによって定量化される。しかし、両方の技術のために、より高いスコアが高いタンパク質発現を示している。 さらに、TMAのテーブルは、将来の参考のためにTMAパンチの位置に注釈を付けます。さらに、データベースはに戻ってこの情報をリンクするために組織のソース(腫瘍、正常、リンパ節、転移性組織)、試料内の位置(中央、端)、癌の組織型、および医療記録番号が含まれています患者テーブル。 DNA検体の表は、実験室内に格納されているすべてのDNAを示しています。 DNAサンプルは、患者の医療記録番号を介して患者のソースにリンクされています。標本についての基本的な情報は、位置と腫瘍の組織型を含め、サンプルのソースを記述するためにキャプチャされます。この表の目的は、ポリメラーゼ連鎖反応、標準DNAシーケンシング、および変異解析を用いて試料内で特徴づけられている遺伝的変化を説明することです。 表はまた、アミノ酸変化、ヌクレオチド変化、ホモ接合性、同義性、そして突然変異が発生している遺伝子のような変数を取り込みます。研究されている遺伝子の例としては、パキシリン、cCbl、EGFR、p53は、KRAS、cMet、およびEphB4が含まれています。変異を特徴としている研究者も記載されています。 データベース内の第五の表では、胸部の腫瘍学会議テーブルです。胸部腫瘍学会議は医療専門医、胸部外科医、病理医、放射線科医、放射線腫瘍医、および協調患者の治療計画を開発するために満たす胸部腫瘍学臨床チームの他のメンバーの週例会議です。この表の目的は、ケアの彼らの標準の一部として、会議で議論されている患者をリストすることです。各患者のための病理標本の可用性に関する情報も、このテーブルでキャプチャされます。 第六表には、細胞株のテーブルです。それは他のテーブルのいずれかにリンクされていないので、これはデータベース内のフリースタンディングのテーブルです。それは利用されている細胞株を説明し研究の目的のために実験室のd。テーブルには、アミノ酸の変化、ヌクレオチド変化、変異のホモ接合性と同義性、および細胞株のDNA内の変異の場所をキャプチャします。 第七の表は、Cです。 虫のテーブル、それはまたフリースタンディングのテーブルです。この表は、オルソロガス受容体チロシンキナーゼを一覧表示し、人間のタンパク質との類似性の尺度である針のスコアが含まれています。 6。テーブル間の関係の確立: 各テーブルは、テーブル内の各エントリの一意の識別子として機能する主キーを、割り当てられています。定義では、一意の識別子の値を繰り返すことはできません。 MRNが1つだけのユニークな個々を示すことができるので、例えば、患者のテーブル内で、主キーは、医療記録番号です。サンプルデータテーブル内で、主キーはサンプル病理学(SP)番号です。 TMAとDNA標本のテーブルに一意な識別子を持っていなかったとして、ダミーの数は、主キーとして設立されました。 TMAとDNAのテーブルは、それぞれ、MRNとSP番号を使用して他のテーブルにリンクされていた。これは、各TMAパンチとDNA標本が寄贈、患者からのサンプルと臨床情報に関する特定の情報の両方に戻ってリンクされていることを保証します。 Microsoft Accessでは、個々のテーブルは、論理的関係は(図3)が確立されるように、彼らの主キーを介して連結されています。これらの関係は、データが複数のテーブルから収集されるクエリを生成するために必要です。 7。照会: 関連するデータのセットのクエリを実行すると、Microsoft Access内では比較的簡単です。クエリは、[作成]タブの下の"クエリのデザインのオプション"を選択して設計することができます。 興味のあるフィールドを含むテーブルを選択し、表示されます。 興味のあるテーブルから変数が選択されていると、必要に応じて、興味のある研究者の基準(図4)に基づいてフィルタリングすることができます。 クエリは、スプレッドシートのフォームに記載されている目的のフィールドで、その結果、実行することができます。 8。データのエクスポート: クエリが生成されたら、データをエクスポートできます。ほとんどの研究者がMicrosoft Excelスプレッドシートの形式になってデータを好む一方で、データは"外部データ"タブの下のエクスポート]メニューを使用して他のプログラムの数にエクスポートすることができます。データは、適切なファイル拡張子を使用して保存することができます。 包括的な分析は共変量をコントロールするために実行できるようにデータが統計目的のためにエクスポートされると、変数の所定のセットがエクスポートに含まれます。 9。データのインポート: データをインポートするとインポートされたデータの形式とAccessのテーブルの形式との間の完全な一致が必要です。インポートするテーブル内で関心のある変数は、Accessのテーブルと同じ名前を持つ必要があります。スペルは正確でなければならず、スペースがAccessのテーブルに存在しないスペースが存在することはできません。 いったん2つのテーブル間の対称性が達成され、ユーザーは、Accessにデータをインポートするためにappendを使用するか、クエリを更新する機能を持っています。追加クエリは、ユーザーがAccessデータベースに新しいデータ行を追加できるようになります。情報がデータベースに入っていない患者についての利用可能な場合例えば、、追加クエリは、それらの患者を追加するために使用することができる。新しいデータを変更する必要がある患者または標本上で使用可能な場合は、更新クエリは、これらのエントリ上で実行する必要があります。 10。データベースの更新: データベースプロジェクトのメンバは、データベースが最新の状態に保たれることを確保する上で役割を規定している。一フルタイム従業員は定期的にクリニックに同意されている患者に基づいて、臨床情報を持つデータベースを移入および更新する役割を担っています。 データマネージャとして機能する別のフルタイムの従業員が、、それが使用可能になると実験室データを取得し、更新または追加クエリを使用してデータベースにこの情報を入力することで充電される。 プロトコルで訓練されている研究のアシスタントは、使用可能な最新のデータを取得するために半年ごとにデータベースの体系的な更新を実行する責任があります。これは、これらのフィールドがデータ上で実行生存分析に直接影響を与えるとして、そのような最後の接触の重要なステータスと日付などの分野では特に重要です。 11。データベースへのアクセス: データベースは、HIPAAに準拠しており、IRBのプロトコルの下に含まれている個人にのみアクセス可能です。アクセスは、さらにデータを更新または変更するための直接的な責任を持つMicrosoft Accessとの訓練を受けた個人に還元される。 データベースに貢献した研究者は、データマネージャからのデータベースから情報を要求するかもしれないが、それ自体はデータに直接アクセスすることはできません。 データマネージャは、エクスポートクエリを生成するときなどの医療記録番号と患者の名前などの変数を削除することによって要求する研究者へのデ – 識別情報を提供します。 12。代表的な結果: 研究者は、非小細胞肺癌における蛋白質パキシリンの過剰発現の臨床的意義を知ることに興味があるかもしれない。この研究者はパキシリンのためのデータベースのTMAの大量のデータを生成しているように、データマネージャは、実験データと相関する臨床情報にアクセスするために研究者の要求を承認。データマネージャは、彼が患者の表とTMAの表の両方を結合するクエリを実行します。患者の表から対象の変数は、患者の生年月日、人種、それらの癌の組織型、それらの癌の病期、診断のその日、彼らの生存状況、死亡の日付、および最後の連絡先の彼らの日付が含まれています。このような診断とステージでの年齢として、これらの変数を使用して、重要な交絡因子が考慮して制御することができます。 TMAのテーブルから、そのような腫瘍のタイプやタンパク質発現などの重要な情報が確認できます。 二つのテーブルが医療記録番号を介して結合しているとして、腫瘍パキシリンの発現のために研究されている個人からの患者情報が出力に含まれます。結果は、非小細胞肺癌患者のみが表示されるようにフィルタリングすることができます。結果は、さらに研究者のニーズに基づいて絞り込むことができます。 これらの結果は、生物統計家による一次データの分析用にエクスポートすることができ、その結果が研究者と共有されます。 プロジェクトのホームページ:Accessデータベースのテンプレートと標準操作手順は下記にてご覧いただけます。 http://www.ibridgenetwork.org/uctech/salgia-thoracic-oncology-access-template ライセンス:学術および非営利使用のため自由に利用できる。 非学者によって使用するための制限:商業ユーザーにはライセンスが必要です。商業用途に関するご質問は、(773)702から1692またはで技術と知的財産(UChicagoTech)のシカ ​​ゴのオフィスの大学に連絡してくださいwww.tech.uchicago.edu 図1患者の表のセクションを描いたAccessデータベースのスクリーンショット。 図2:回路図は、組織マイクロアレイ(TMA)2を描いた 図3:スクリーンショットAccessデータベース内のテーブル間で確立された関係を描いた。テーブルは主キーを介して連結されています。 図4。パキシリン突然変異、TMAの結果、および臨床的変数のサンプルクエリ。

Disclosures

The authors have nothing to disclose.

Acknowledgements

この作品は、NIHの助成金5R01CA100750 – 07、5R01CA125541 – 04、3R01CA125541 – 03S1、5R01CA129501 – 03、RSへ3R01CA129501 – 02S1によってサポートされていました

Materials

Material Name Company Catalogue Number
Centrifuge Eppendorf
Conical centrifuge tube Falcon 518-PG
Minimum essential medium eagle (MEM) Sigma M4655-500ML
Fetal Calf Serum Cellgro FBS HI MTT35011CV
Dimethyl Sulfoxide (DMSO) American Bioanalytical AB03091
BD Vacutainer Serum Tubes Fischer Scientific 367815

References

  1. Adamski, J., Finnegan, K. New Perspectives on Microsoft Office Access. , (2007).
  2. Giltnane, J., Rimm, D. Technology Insight: Identification of biomarkers with tissue microarray technology. Nat Clin Pract Oncol. 1, 104-111 (2004).

Play Video

Cite This Article
Surati, M., Robinson, M., Nandi, S., Faoro, L., Demchuk, C., Kanteti, R., Ferguson, B., Gangadhar, T., Hensing, T., Hasina, R., Husain, A., Ferguson, M., Karrison, T., Salgia, R. Generation of Comprehensive Thoracic Oncology Database – Tool for Translational Research. J. Vis. Exp. (47), e2414, doi:10.3791/2414 (2011).

View Video