背景
深層学習の登場により、CT画像からの肺結節検出やその良悪性鑑別を行うCADシステムが多数提案されてきたが、性状特徴を抽出するCADシステムの研究は非常に少なく、分析可能な性状の種類も少なかった。ここで、性状特徴とは、例えば肺結節におけるすりガラス型、充実型等を指す。性状特徴の認識は、放射線科医であれば日常的に行っているのにも関わらず、なぜそのCADシステムが提案されてこなかったのか。最大の理由は、訓練データ(ラベル付きデータ)の構築が難しいことだ。深層学習を行うためには、大量のデータを準備し、それらに正解となるラベルを付けなければならない(図1)。しかし、ラベル付けには時間がかかることに加え、性状特徴の認識には非常に高度な専門的知識が必要だった。そのため、高度な医学的知識を持たないCADシステムの開発者が、十分なラベル付きデータを準備することは難しかったのである。
アプローチ
今回紹介する論文[1]では、ラベルをゼロから付与するのではなく、放射線科医が日常業務で画像所見を記載する読影レポートを解析し、自動的に画像にラベルを付与する手法(図2)を提案している。ポイントは、言語処理AIと画像認識AIの2つを組み合わせて性状特徴の抽出を行う点である。まず、大学病院より収集した肺結節所見文に対してNon-Expertsが所見文に出現する性状特徴をラベル付けし、これを正解データとしてラベル抽出AI(言語処理AI)を学習する。所見文のラベル付けであれば、「すりガラス影」「充実成分」等の言語を分類するだけで良いため、高度な専門的知識を持たずとも可能である。このラベル抽出AIを用いると、所見文と画像のペアがあれば、所見文から性状ラベルを抽出し、性状ラベルと画像のペアを大量に作成することができる。こうして作成した性状ラベルと画像のペアを正解データとすれば、性状特徴抽出AI(画像認識AI)を学習できる。本論文では、放射線科医がマニュアルでラベリングしたデータで学習させたモデルと、提案手法で学習させたモデルの性能を比較し、これらの間で性能にほとんど差が見られなかった(図3-4)。
まとめ
本論文が提案した読影レポートを活用したラベル付けで肺結節の画像特徴を学習するフレームワークを用いると、これまでCADシステム開発のボトルネックとなっていた高度な専門的知識が必要なラベル付けを省くことができる。病院には大量の画像とレポートのペアがあるため、本手法を用いると大規模な学習データセットを構築可能である。将来的には、肺結節に関してより詳細な性状分析を行ったり、肺炎などの他の肺疾患や、肝臓や脳などの他の臓器の性状分析を行うCAD開発に本手法が活かされることが期待できるだろう。
[1] Momoki, Yohei, et al. “Characterization of Pulmonary Nodules in Computed Tomography Images Based on Pseudo-Labeling Using Radiology Reports.” IEEE Transactions on Circuits and Systems for Video Technology 32.5 (2021): 2582-2591.
DOI: https://doi.org/10.1109/TCSVT.2021.3073021
ご注意:
本ページに記載された技術情報・論文内容は、弊社製品搭載技術とは異なる場合があります。
全ての技術は、必要な法規制認可を得た上で製品搭載を予定します。
製品搭載時の仕様および外観は本Webサイトの内容とは異なります。