GoogleのオープンソースAIが肺がんの種類を極めて正確に診断!

以前、当社のOpen ScienceとAIの記事では、ヘルスケアと医学を含むさまざまなアプリケーションを通じて、Open Source ScienceとAIの重要性について詳しく説明してきました。 最近、これらの分野で新たな進歩が見込まれています。

癌の病理医は今や高度なオープンソースAIシステムを利用することができます。これは現在、ある種の肺癌の検出において極めて高いレベルの精度を達成しています!

これは、2年前にこのビデオで詳しく説明されている、ニューヨーク大学(NYU)のイノベーターと研究者の多くのビジョンのうちの1つの実現です。

彼らのAIシステムはDeepPATHと呼ばれ、ディープラーニングアーキテクチャの使用を研究するために使用されてきたコードを集めるオープンソースフレームワークです(Google inception v3)。

NYUの研究者がDeepPATHフレームワークを設計したので、AI支援療法の将来はこれまで以上に有望に見えます。 彼らのアルゴリズムは、正常組織と癌罹患組織の両方からなる肺の画像を識別し識別するようにそれを訓練するように設計されています。

なぜこの素晴らしいニュースですか。

世界中で最も一般的な癌の形態は肺癌です。 これまでのところ2018年には、肺がんの単独で発生した176万の死と、209万の肺がんの症例が報告されています。 WHOはそれを鮮やかに詳述します。

4つの主要な癌の危険因子があります:

  • たばこ用
  • アルコール使用、
  • 不健康な食事
  • 運動不足

Natureの論文(ここで利用可能なプレプリント)は「深層学習を用いた非小細胞肺癌の病理組織像からの分類と突然変異の予測」と題し、97%の精度で肺がんの種類を特定するアルゴリズムの有効性を強調しています。

新しい研究が癌病理医に役立つのはなぜですか?

研究者らは、肺がんの最も一般的なサブタイプである腺がん(LUAD)と扁平上皮がん(LUSC)の2つの特定の肺がんタイプを区別するために彼らのAIアルゴリズムを教えることによって新しい功績を達成した。

左の画像(肺からの癌性組織切片)に基づいて、AIは右に見えるようにそれを3つのカテゴリーに分類します:LUADは赤、LUSCは青、そして正常/健康肺組織は灰色で表示されています。 ここの画像ソース

従来の医療行為では、経験豊富な病理学者による目視検査は、ある肺癌タイプを他のものと明確に識別するために絶対に不可欠です。 彼らのディープラーニングモデルのパフォーマンスは、この研究に参加するように依頼された3人の病理学者(2人の胸部と1人の解剖学)のそれぞれに匹敵するので、今、AIは同じタスクを実行できます。 !

グーグルのインセプションv3は病理学者の手動選択に基づいて腫瘍領域を認識するように訓練された。 NYUの研究者らはThe Cancer Genome Atlasから得た全スライド画像について深い畳み込みニューラルネットワーク(Google inception v3)を訓練し、それらをLUAD、LUSCまたは正常肺組織に知的に分類した。

癌性組織を特定することに加えて、チームはそれを組織内の遺伝子変異を特定するように訓練しました。 LUADにおいて最も一般的に突然変異した10個の遺伝子のうち、それらのうちの6個、すなわちSTK11、EGFR、FAT1、SETBP1、KRASおよびTP53が予測された。

それだけでなく、AIの科学者チームは、分類を大細胞癌、小細胞肺癌、およびLUADの組織学的サブタイプなどの他の種類のあまり一般的でない肺癌にも拡張するために同じアルゴリズムを適用する将来の側面をレイアウトしましたそしてまた、壊死、線維症、および腫瘍微小環境における他の反応性変化を含む、非腫瘍性の特徴(腫瘍性は腫瘍に関連する)。

彼らはまた、そのようなアプリケーションのための現時点でのデータ不足について言及しました。 しかし、将来的には、このようなケースが増えて最終的に見られるようになると、アルゴリズムでそれらをトレーニングするために、さらに多くのデータセットも利用可能になる必要があります。

チームによる徹底的な学習研究全体は、(従来の中央処理装置(CPU)と比較して)グラフィック処理装置(GPU)の著しく高い計算能力を利用することによって加速されました。 特にTesla K20m GPUを1台使用し、処理時間は約20秒でした。 しかし彼らはまた、複数のGPUを使用することで、その時間がさらに数秒に短縮されることを強調しました。

このニュースのうちで最もお気に入りの部分は、もちろん、DeepPATHのコード全体がオープンソースであり、GitHubですぐに利用できることです。 これは、AIを使って自分のデータセットを分析し解釈するために同じシステムを適用したいと思う同様の研究プロジェクトで働いている学者や研究者(個人とグループの両方)にとって本当に役に立つでしょう。 これらのデータセットは、私たちの社会に利益をもたらす可能性のあるあらゆる形式のものです。

前回の記事でデータセットについて説明しました。ここでは、NASAのOpen Scienceイニシアチブを利用して、Open Data Portalに投稿してデータセットの提案を求める方法について説明しました。 おそらくそこで利用可能なデータセットは、グーグルのオープンソースAIにとって非常に有益かもしれません?

これはApplied Open Source AIにとって驚くべき新しいマイルストーンではないでしょうか。 オープンソースのアプローチで、今後のApplied AIのそのような開発をもっと見たいですか。 以下のコメントであなたの考えを教えてください。

推奨されます

Ubuntu 17.10新機能とアップグレード手順
2019
Ubuntuおよび他のLinuxディストリビューションに最新のLibreOfficeをインストールする方法
2019
Solus 3がリリースされました。 新機能をチェックする
2019