© FUJIFILM Corporation

読影レポートを活用した「肺結節の性状を分析するAI」の学習手法

2022.09.29論文解説

背景

深層学習の登場により、CT画像からの肺結節検出やその良悪性鑑別を行うCADシステムが多数提案されてきたが、性状特徴を抽出するCADシステムの研究は非常に少なく、分析可能な性状の種類も少なかった。ここで、性状特徴とは、例えば肺結節におけるすりガラス型、充実型等を指す。性状特徴の認識は、放射線科医であれば日常的に行っているのにも関わらず、なぜそのCADシステムが提案されてこなかったのか。最大の理由は、訓練データ(ラベル付きデータ)の構築が難しいことだ。深層学習を行うためには、大量のデータを準備し、それらに正解となるラベルを付けなければならない(図1)。しかし、ラベル付けには時間がかかることに加え、性状特徴の認識には非常に高度な専門的知識が必要だった。そのため、高度な医学的知識を持たないCADシステムの開発者が、十分なラベル付きデータを準備することは難しかったのである。

アプローチ

本論文では、ラベルをゼロから付与するのではなく、放射線科医が日常業務で画像所見を記載する読影レポートを解析し、自動的に画像にラベルを付与する手法(図2を提案している。ポイントは、言語処理AIと画像認識AIの2つを組み合わせて性状特徴の抽出を行う点である。まず、大学病院より収集した肺結節所見文に対してNon-Expertsが所見文に出現する性状特徴をラベル付けし、これを正解データとしてラベル抽出AI(言語処理AI)を学習する。所見文のラベル付けであれば、「すりガラス影」「充実成分」等の言語を分類するだけで良いため、高度な専門的知識を持たずとも可能である。このラベル抽出AIを用いると、所見文と画像のペアがあれば、所見文から性状ラベルを抽出し、性状ラベルと画像のペアを大量に作成することができる。こうして作成した性状ラベルと画像のペアを正解データとすれば、性状特徴抽出AI(画像認識AI)を学習できる。本論文では、放射線科医がマニュアルでラベリングしたデータで学習させたモデルと、提案手法で学習させたモデルの性能を比較し、これらの間で性能にほとんど差が見られなかった(図3-4)。

まとめ

本論文が提案した読影レポートを活用したラベル付けで肺結節の画像特徴を学習するフレームワークを用いると、これまでCADシステム開発のボトルネックとなっていた高度な専門的知識が必要なラベル付けを省くことができる。病院には大量の画像とレポートのペアがあるため、本手法を用いると大規模な学習データセットを構築可能である。将来的には、肺結節に関してより詳細な性状分析を行ったり、肺炎などの他の肺疾患や、肝臓や脳などの他の臓器の性状分析を行うCAD開発に本手法が活かされることが期待できるだろう。

図1. これまでのアプローチ [[1]より引用改変](Expertが画像を確認して性状ラベルを付与)
図2. 提案アプローチ [[1]より引用改変](読影レポートを活用して性状ラベルを付与)
図3. 提案手法とマニュアルラベリング手法の性能比較[1]
図4. 提案手法による病変特徴抽出AIの出力例[1]
[1] Momoki, Yohei, et al. “Characterization of Pulmonary Nodules in Computed Tomography Images Based on Pseudo-Labeling Using Radiology Reports.” IEEE Transactions on Circuits and Systems for Video Technology 32.5 (2021): 2582-2591.

 

DOI: https://doi.org/10.1109/TCSVT.2021.3073021

一覧