少ない学習データで高精度に解析　産業分野でAI運用が可能に：東芝が画像解析AIを開発

東芝は、少ない実画像データしかない場合でも、独自の事前学習方法により迅速かつ高精度に解析できる「画像解析AI」を開発した。学習データが十分に得られない産業分野などでもAIの運用が可能となる。

LINE

Hatena

ウエハー画像や病理画像など限られた実画像データから類似データを生成

　東芝は2024年12月、少ない実画像データしかない場合でも、独自の事前学習方法により迅速かつ高精度に解析できる「画像解析AI」を開発したと発表した。学習データが十分に得られない産業分野などでもAIの運用が可能となる。

　精度の高い画像解析AIを構築するには、一般的に数万枚以上という大量の実画像データを用いAIを学習させる必要がある。ところが、ICの製造現場におけるウエハー画像や、医療現場における病理画像といった産業画像（非自然画像）は、大量に入手することが難しい。

　このように、少量の画像データしか用意できない場合は、解析したい画像と特性の近い画像による大規模なデータセットを用い、その特徴をAIに学習させることで解析精度を高める「事前学習」が有効といわれている。ただ、非自然画像では、カメラで撮影した画像（自然画像）に比べ十分な精度が得られないという課題もあった。

自然画像と非自然画像の例［クリックで拡大］出所：東芝

　そこで東芝は、独自の事前学習技術により、少数の実画像データを基に学習データを自動生成し、迅速かつ高精度に解析できる画像解析AIを開発した。具体的には、対象画像の一部を切り出した画像を複数組み合わせる。これらの画像をランダムに回転・反転させ1枚の画像として結合する。この中から再度部分的に画像を切り出す。これらの作業を行うことによって、似たような特徴を持つ画像を生成する。こうして生成した画像を学習データとして事前学習させることで、画像解析AIの精度を向上させた。

従来技術と開発技術の比較［クリックで拡大］出所：東芝

開発した技術で事前学習用画像を生成する手順［クリックで拡大］出所：東芝

　開発した画像解析AIの精度について、公開されている5種類の非自然画像データセット（赤外線画像、顕微鏡画像、ウエハー画像、病理画像および、眼底画像）を用いて評価した。各データセットでランダムに選択した40～1000枚の画像データを用い、9000～3万枚の事前学習用画像を生成し、画像を識別した。この結果、ImageNet（学習データは130万枚）を用いて事前学習した時を上回る精度で画像の識別ができたという。

非自然画像公開データセットを用いた識別タスクによる評価結果［クリックで拡大］出所：東芝

　東芝は今後、東芝デジタルソリューションズと連携し実証を進める。と同時に精度をさらに高める研究に取り組み、早期実用化を目指す。

少ない学習データで高精度に解析　産業分野でAI運用が可能に：東芝が画像解析AIを開発

ウエハー画像や病理画像など限られた実画像データから類似データを生成

関連記事

関連リンク

少ない学習データで高精度に解析 産業分野でAI運用が可能に：東芝が画像解析AIを開発

ウエハー画像や病理画像など限られた実画像データから類似データを生成

関連記事

関連リンク

少ない学習データで高精度に解析　産業分野でAI運用が可能に：東芝が画像解析AIを開発