この記事では、固定細胞の蛍光顕微鏡画像でミトコンドリアの形態を分析するために、シミュレーション教師あり機械学習を使用する方法について説明します。
細胞蛍光顕微鏡画像におけるミトコンドリアなどの細胞内オルガネラの定量的分析は、これらの小さく形態学的に多様な構造のセグメンテーションに固有の課題があるため、困難な作業です。本稿では、固定細胞の蛍光顕微鏡画像におけるミトコンドリア形態の定量化のための機械学習支援セグメンテーションおよび分析パイプラインの使用を示します。ディープラーニングベースのセグメンテーションツールは、シミュレートされた画像でトレーニングされ、教師ありディープラーニングのグラウンドトゥルースアノテーションの必要性を排除します。蛍光ミトコンドリアマーカーを安定発現させた固定心筋芽細胞の蛍光顕微鏡画像に対するこのツールの有用性を実証し、特定の細胞培養条件を使用してミトコンドリアの形態変化を誘導します。
本論文では、蛍光ミトコンドリアマーカーを発現する固定心筋芽細胞の蛍光顕微鏡画像における細胞内セグメンテーション1 のための物理ベースの機械学習ツールの有用性を実証します。
ミトコンドリアは、哺乳類細胞の主要なエネルギー産生細胞小器官です。具体的には、ミトコンドリアは非常に動的な細胞小器官であり、長さと分岐が絶えず変化しているネットワークによく見られます。ミトコンドリアの形状はその機能に影響を与え、細胞は環境の変化に適応するためにミトコンドリアの形態を素早く変化させることができます2。この現象を理解するために、ミトコンドリアをドット、ロッド、またはネットワークとして形態学的に分類することは非常に有益です3。
ミトコンドリアのセグメンテーションは、細胞内のミトコンドリア形態の解析に不可欠です。ミトコンドリアの蛍光顕微鏡画像をセグメント化および分析する現在の方法は、手動セグメンテーションまたは従来の画像処理アプローチに依存しています。大津4 のような閾値ベースのアプローチは、顕微鏡画像のノイズレベルが高いため、精度が低くなります。通常、ミトコンドリアの形態学的解析用の画像は多数のミトコンドリアを特徴としているため、手動のセグメンテーションは面倒です。MorphoLibJ5 のような数学的アプローチやWeka6 のような半教師あり機械学習アプローチは非常に要求が厳しく、専門知識が必要です。ミトコンドリア7 の画像解析技術のレビューは、深層学習ベースの技術がこのタスクに役立つ可能性があることを示しました。実際、自動運転などのアプリケーション向けの日常生活画像の画像セグメンテーションは、ディープラーニングベースのモデルの使用によって革命を起こしました。
ディープラーニングは、大量のデータから学習するアルゴリズムを提供する機械学習のサブセットです。教師ありディープラーニングアルゴリズムは、グラウンドトゥルース(GT)ラベルで注釈が付けられた大量の画像セットから関係を学習します。蛍光顕微鏡画像でミトコンドリアをセグメント化するために教師ありディープラーニングを使用する場合の課題は2つあります。まず、教師ありディープラーニングにはトレーニング画像の大規模なデータセットが必要であり、蛍光顕微鏡の場合、この大規模なデータセットを提供することは、より簡単に利用できる従来のカメラベースの画像を使用する場合と比較して、広範なタスクになります。第二に、蛍光顕微鏡画像は、トレーニング画像内の関心のあるオブジェクトのGTアノテーションを必要としますが、これは専門知識を必要とする面倒な作業です。この作業は、蛍光標識された細胞内構造を持つ細胞の単一の画像に対して、専門家の時間の数時間または数日かかることがあります。さらに、アノテーター間のばらつきも問題となります。手動アノテーションの必要性を排除し、ディープラーニング技術の優れたパフォーマンスを活用できるようにするために、ここでは、シミュレートされた画像でトレーニングされたディープラーニングベースのセグメンテーションモデルが使用されました。物理ベースのシミュレータは、顕微鏡での画像形成のプロセスを模倣および制御する方法を提供し、既知の形状の画像の作成を可能にします。物理ベースのシミュレータを利用して、ミトコンドリアのシミュレートされた蛍光顕微鏡画像の大規模なデータセットがこの目的のために作成されました。
シミュレーションは、形状生成にパラメトリックカーブを使用したジオメトリ生成から始まります。エミッタは、密度が実験値と一致するように均一に分布した方法で形状の表面にランダムに配置されます。顕微鏡の3次元点像分布関数(PSF)は、ギブソン・ラニモデル9の計算効率の高い近似8を用いて計算される。シミュレーション画像と実験画像とを厳密に一致させるために、暗電流とショットノイズの両方をエミュレートして、写真のリアリズムを実現します。物理 GT はバイナリ マップの形式で生成されます。データセットを生成し、シミュレーションモデルをトレーニングするためのコードが利用可能であり10、このシミュレートされたデータセットを作成する手順を図1に示します。
固定心筋芽細胞の共焦点顕微鏡画像を解析することにより、シミュレートされたデータセットで完全にトレーニングされたディープラーニングベースのセグメンテーションの有用性を紹介します。これらの心筋芽細胞は、ミトコンドリア外膜に蛍光マーカーを発現し、蛍光顕微鏡画像におけるミトコンドリアの可視化を可能にした。ここで例として挙げた実験を行う前に、細胞からグルコースを奪い、培養中で7日間ガラクトースに適応させた。増殖培地中のグルコースをガラクトースに置き換えると、培養中の細胞がより酸化的になり、したがって、エネルギー生産をミトコンドリアに依存するようになります11,12。さらに、これにより、細胞はミトコンドリアの損傷に対してより敏感になります。ミトコンドリアの形態変化は、細胞培養培地13にカルボニルシアン化物m−クロロフェニルヒドラゾン(CCCP)などのミトコンドリア脱共役剤を添加することによって実験的に誘導することができる。CCCPはミトコンドリア膜電位(ΔΨm)の喪失をもたらし、したがって、ミトコンドリアをより管状(棒状)からより球状(ドット状)の形態に変化させる14。さらに、ミトコンドリアはCCCP治療中に腫脹する傾向があります15。ガラクトース適応心筋芽細胞をミトコンドリア脱共役CCCPで処理した場合のミトコンドリア変化の形態分布を表示します。ミトコンドリアの深層学習セグメンテーションにより、ミトコンドリアをドット、ロッド、またはネットワークとして分類することができました。次に、さまざまなミトコンドリア表現型の枝の長さと存在量を評価するための定量的指標を導き出しました。解析のステップを図2に概説し、細胞培養、イメージング、ディープラーニングによるセグメンテーションのためのデータセット作成、ミトコンドリアの定量解析の詳細を以下に示します。
プロトコルの重要なステップに関連する注意事項については、「ジオメトリ生成」と「シミュレータパラメータ」の段落で説明します。「転移学習」というタイトルの段落では、複数の顕微鏡に適応する際のスループットを高めるための変更について説明します。「粒子分析」および「他の細胞内構造の生成」に関する段落は、この方法の将来の応用に言及している。「生物学的真実との違い」に関する段落では、シミュレーションが実際のデータと異なる可能性があるさまざまな理由と、これらの理由がアプリケーションに影響を与えるかどうかについて説明します。最後に、「密集した構造」の段落で、この方法の困難なシナリオについて説明します。
ジオメトリ生成
ミトコンドリアの3Dジオメトリを生成するには、bスプライン曲線をスケルトンとして作成した単純な2D構造が合成データセットの作成に適しています。これらの合成形状は、2D細胞培養で観察されるミトコンドリアの形状に厳密にエミュレートしています。しかし、心臓組織などの3D組織の場合、ミトコンドリアの形状や配置はかなり異なります。このような場合、セグメンテーションモデルのパフォーマンスは、シミュレートされた画像に方向性を追加することで向上する可能性があります。
シミュレーターのパラメーター
シミュレーターのパラメーターを設定するときは、推論を実行するデータのパラメーターと一致するように設定しないと、セグメンテーションのパフォーマンスが低下する可能性があるため、注意が必要です。そのようなパラメータの1つが信号対雑音比(SNR)範囲です。テストするデータの SNR の範囲は、シミュレートされたデータセットの値と一致する必要があります。さらに、使用するPSFは、ターゲット・テスト・データのPSFと一致する必要があります。例えば、共焦点PSFからのモデルトレーニング画像は、落射蛍光顕微鏡からの画像のテストには使用しないでください。注意すべきもう一つのパラメータは、テストデータで追加の倍率を使用することです。テストデータで追加の倍率が使用されている場合は、シミュレーターも適切に設定する必要があります。
転移学習
転移学習は、あるタスクでトレーニングされた学習済みモデルを別のタスクで使用するために活用する現象です。この現象は、さまざまな種類の顕微鏡データに関連する私たちの問題にも当てはまります。あるタイプの顕微鏡データでトレーニングされたセグメンテーションモデル(ソースコードで提供)の重みを使用して、別のタイプの光学顕微鏡データで使用するセグメンテーションモデルを初期化できます。これにより、トレーニングデータセットの大幅に小さなサブセット(10,000枚に対して3,000枚の画像)でトレーニングできるため、シミュレーションの計算コストを削減できます。
粒子分析
粒子解析は、セグメント化されたマスクに対しても実行できます。これにより、個々のミトコンドリアの面積や曲率などの情報を得ることができます。この情報は、ミトコンドリアの定量的比較の指標としても役立ちます(この実験には使用されません)。例えば、現在のところ、ミトコンドリアの長さに基づく閾値を用いてドット形態を定義している。場合によっては、楕円率を組み込んで、小さな棒状のミトコンドリアを点状または点状のミトコンドリアからよりよく分離することが有用であり得る。あるいは、特定の生物学的条件によってミトコンドリアが丸くなる場合は、ミトコンドリア集団を分析するために曲率の定量化が興味深い場合があります。
他の細胞内構造の生成
物理ベースの細胞内構造のセグメンテーションは、ミトコンドリアと小胞について実証されています1。小胞はさまざまな形状を示しますが、サイズは小さく、蛍光顕微鏡で観察すると単純な球体に見えます。したがって、小胞の形状は、適切な直径範囲の球構造を使用してシミュレートされます。これは、関数の変更が構造の形状(ミトコンドリアの場合は円柱、小胞の場合は球)とそれぞれのパラメータを生成することを意味します(プロトコルセクションのステップ5.4)。幾何学的には、小胞体および微小管も管状構造体としてシミュレートされている17。直径150 nmの小胞体と平均外径25 nmの微小管、直径15 nmの内側の中空管をモデル化することで、これらの構造の形状の近似が得られます。これらの細胞内構造のそれぞれについて変化する別のパラメータは、蛍光色素密度である。これは、蛍光色素が結合する生体分子の分布と結合確率に基づいて計算されます。
生物学的グラウンドトゥルースとの違い
ディープラーニングモデルのシミュレーション教師ありトレーニングに使用されるシミュレーションデータは、多くの点で実際のデータと異なります。(i)シミュレーションデータに非特異的標識が含まれていないのは、実データに浮遊蛍光色素が存在することが多いため、実データとは異なります。これにより、実際の画像の平均背景値が高くなります。この差は、SNRを一致させ、観測された実際の値と一致するように背景値を設定することで軽減されます。(ii)細胞内構造の運動と光動力学は、システム内のダイナミクスの2つの源です。生細胞内の移動する構造(数ミリ秒の範囲で移動する)は、モーションブラーを引き起こします。ぼかし効果を回避するために、実際のデータ収集中の露光時間が短縮されます。一方、タイムラプスをシミュレートせず、動かない構造を想定します。この仮定は、実データの露光時間が小さい場合に有効です。ただし、この仮定により、実際のデータの露光時間がモーション ブラーを導入するのに十分な大きさである場合、出力に誤差が生じる可能性があります。一方、光動力学はナノ秒からマイクロ秒のオーダーであり、実験の通常の露光時間は光動力学の効果を平均化するのに十分な長さ(ミリ秒のオーダー)であるため、シミュレーションでは省略できます。(iii)顕微鏡画像のノイズは異なる発生源を持ち、これらの発生源は異なる確率密度関数を持っています。これらの個々のノイズ源をモデル化する代わりに、一定のバックグラウンド上のガウスノイズとして近似します。この差は、シグナル対バックグラウンド比が低い条件(2〜4の範囲)および蛍光色素1のマクロ密度を扱う場合のデータ分布を大きく変えることはありません。(iv)イメージングのアーティファクトは、収差、ドリフト、および体系的なぼやけから発生する可能性があります。顕微鏡は整列しており、実際のデータで分析するために選択された領域にはこれらのアーチファクトがないと仮定します。これらのアーティファクトのいくつかをPSF 18,19,20でモデル化する可能性もあります。
密集した構造
重なり合うロッドとネットワークを区別できないことの難しさは、2D顕微鏡データのセグメンテーションにおける永続的な問題です。非常に困難なシナリオが 図5に提示されており、ミトコンドリアが密集しているため、セグメンテーションモデルと次の分析で最適ではない結果が得られます。この課題にもかかわらず、このような状況で形態学的演算子を使用してスケルトン化をスリムにすることは、すべてのミトコンドリア形態カテゴリの有意な変化を引き続き検出できるようにしながら、これらの過度に接続されたネットワークを壊すのに役立ちます。さらに、イメージングに広視野顕微鏡ではなく共焦点顕微鏡を使用することは、焦点が合っていない光を排除することによってこの問題を部分的に軽減する1つの方法です。さらに将来的には、交差する(物理的にネットワークを形成する)ミトコンドリアと、単一の平面内の突起が互いに重なる棒状のミトコンドリアを区別するために3次元セグメンテーションを行うことが有用であると考えられる。
ディープラーニングセグメンテーションは、顕微鏡ユーザーの分析機能を拡張する有望なツールであり、以前は管理できなかった複雑なデータや大規模な定量データセットの自動分析の可能性を開きます。
The authors have nothing to disclose.
著者らは、アリフ・アフメド・セクとの議論を認める。ザンバラル・ブジャバルは、安定したH9c2細胞の構築に貢献したことで知られています。ERC開始助成金番号804233(KAへ)、科学再生のための研究者プロジェクト助成金番号325741(DKへ)、ノルウェー北部地域保健局助成金番号HNF1449-19(Å.B.B.)、およびUiTのテーマ別資金提供プロジェクトVirtualStain with Cristin Project ID 2061348(D.K.P.、Å.B.B.、K.A.、およびA.H.)。
12-well plate | FALCON | 353043 | |
Aqueous Glutaraldehyde EM Grade 25% | Electron Microscopy Sciences | 16200 | |
Axio Vert.A1 | Zeiss | Brightfield microscope | |
CCCP | Sigma-Aldrich | C2759 | |
Computer | n/a | n/a | Must be running Linux/Windows Operating System having an NVIDIA GPU with at least 4GB of memory |
Coverslips | VWR | 631-0150 | |
DAPI (stain) | Sigma-Aldrich | D9542 | |
DMEM | gibco | 11966-025 | |
Fetal Bovine Serum | Sigma-Aldrich | F7524 | |
Glass Slides (frosted edge) | epredia | AA00000112E01MNZ10 | |
H9c2 mCherry-EGFP-OMP25 | In-house stable cell line derived from purchased cell line | ||
Incubator | Thermo Fisher Scientific | 51033557 | |
LSM 800 | Zeiss | Confocal Microscope | |
Mounting Media (Glass) | Thermo Fisher Scientific | P36980 | |
Paraformaldehyde Solution, 4% in PBS | Thermo Fisher Scientific | J19943-K2 | |
Plan-Apochromat 63x oil (M27) objective with an NA of 1.4 | Zeiss | 420782-9900-000 | |
Sterile laminar flow hood | Labogene | SCANLAF MARS | |
Trypsin | Sigma-Aldrich | T4049 | |
Vacusafe aspiration system | VACUUBRAND | 20727400 | |
ZEN 2.6 | Zeiss |