© FUJIFILM Corporation

読影レポート二次活用のための構造化技術の確立および大規模データセットの構築

2026.01.16論文解説

背景 

読影レポートは、放射線科医がCTなどの医用画像を観察し、異常所見や疑われる病名などを網羅的に記載した文書である。読影レポートは医師の思考過程が言語化された貴重な情報であり、二次活用が期待されているが、自由記述文での記載が主流であり、記載内容をそのまま利用することは困難である。読影レポートから異常所見や関連する病名などの情報を抽出・整理(構造化と呼ぶ)できれば、画像診断支援機能の開発などに活用できる。読影レポート構造化には二次活用に適した構造化の仕様が確立していないことや構造化を評価するためのデータセットが不足しているといった課題がある。

アプローチ

今回紹介する論文[1]は、上述の課題を解決するため、異常所見を中心に読影レポートを構造化する「Finding-Centric Structuring」を提案している。読影レポートでは、画像上の複数の所見をまとめて一文に記載することがあり、従来ではそれぞれの所見ごとに関連する区域や病名などの情報を抽出することは困難であった。本論文では、所見ごとに構造化するための、固有表現抽出(Named Entity Recognition, NER1と関係抽出(Relation Extraction, RE2、さらにグラフ構造を用いたルールベース処理を提案している(図1)。これにより、複雑なレポートでも、所見ごとに構造化でき、レポートの二次活用が容易となる。
また、実際の運用では多様なレポートに対して高精度な構造化が求められる。そのため、本論文では多様な臓器・疾患を含む多施設から収集した約8,400件の大規模レポートデータセットを構築し、モデルの性能を評価している。単一施設のレポートのみで学習したモデルを他施設のレポートに適用した場合、施設間で大きな性能差が認められたが、性能劣化の要因に基づいたデータ拡張により、単一施設のレポートのみを学習に用いる場合であっても、多施設レポートに対する効率的な性能向上が可能であることを示している(表1,2)。

※1 文章から予め定義した異常所見や病名などのクラスに該当する用語を抽出する技術
※2 文章中の固有表現間の関係性の有無および関係の種類を判定する技術

図1. 提案手法「Finding-Centric Structuring」の概要 [1]
表1. NER、RE、Finding-centric Graph Score (FGS)のF1スコア [1]
表2. 施設ごとのFGS F1スコア(REモデルは固定し、NERモデルに40%のデータ拡張を追加)[1]

まとめ

本論文では、読影レポートを二次活用しやすい形式に構造化する「Finding-Centric Structuring」を提案し、大規模データセットによる評価を実施した。将来的には、本技術の多言語/他モダリティへの拡張や、より高度な画像診断支援機能の開発などに活かされることが期待される。

[1] Tagawa, Yuki, et al. “Finding-Centric Structuring of Japanese Radiology Reports and Analysis of Performance Gaps for Multiple Facilities.” Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 3: Industry Track). 2025.

DOI:  10.18653/v1/2025.naacl-industry.7


ご注意:
本ページに記載された技術情報・論文内容は、弊社製品搭載技術とは異なる場合があります。
全ての技術は、必要な法規制認可を得た上で製品搭載を予定します。
製品搭載時の仕様および外観は本Webサイトの内容とは異なります。

一覧