メディア

少ない計算リソースで高精度、東芝の文書理解AIインフラ分野特化型

東芝は2023年3月13日、工場やプラントなどのインフラ分野において、専門データを高効率/高精度に認識し、保守点検の効率化を実現する専門分野に特化した「インフラ文書理解AI」を開発したと発表した。

» 2023年03月14日 11時30分 公開
[半田翔希EE Times Japan]

 東芝は2023年3月13日、工場やプラントなどのインフラ分野において、蓄積された機器の図面/仕様書や、点検、トラブル記録などの専門データを高効率/高精度に認識し、保守点検の効率化を実現する専門分野に特化した「インフラ文書理解AI(人工知能)」を開発したと発表した。

保守点検の課題を解決、高まる需要に向け

 東芝によると、インフラ分野で導入されている設備では、老朽化と慢性的な人手不足が課題となっている。そのため、省人化につながる保守点検サービスの需要が高まっていて、富士経済によれば、国内の市場規模は2025年に2兆9350億円になる見込みだという。

 老朽化した設備の保守点検には、熟練者の知識や経験が蓄積されている保守点検の経緯や記録を把握する必要があるが、現状、それらは業務に活用できるほど整理されていないという課題がある。また、文書を高精度に理解するための基盤技術として、大規模な汎用言語モデルが知られているが、専門性の高いインフラ分野では計算規模が大きくなってしまうため、計算リソースの確保が困難だという。

 これらの課題を解決するものとして、東芝は今回、一般用語と専門用語を効率よく学習することで小規模な言語モデル(生徒モデル)の生成を実現し、少ない計算リソースで高精度に専門的な文書を理解できるAIを開発したとしている。

学習用の文書量、従来方法の100分の1に

 同AIでは、一般用語を習得した大規模な汎用言語モデルを教師モデルとして一般用語を学習すると同時に、別カリキュラムで専門用語も学習する小規模な特化言語モデル(生徒モデル)を生成。生徒モデルは、一般用語と専門用語を同時に学習することで、一般用語を忘却することなく専門用語を習得することが可能だ。なお、現状対応可能な教師データは、デジタルかつテキストデータに限られているという。

 東芝は、電力設備の保守点検記録に記載されたトラブルに関する表現を見つける言語解析試験(情報抽出タスク)で、同AIの有効性を検証した。その結果、同AIで生成する生徒モデルの計算規模は、従来のような一から学習する大規模な汎用言語モデルの半分に、学習に使用する文書量は従来方法の100分の1にまで削減。学習時間も、従来方法が1週間程度なのと比べ97%減の5時間程度に短縮できたという。

文書理解AI技術の概要 文書理解AI技術の概要[クリックで拡大] 出所:東芝

 精度についても、電力設備の保守点検記録に記載された、トラブル発生時の機器状態やその対策が記載された場所を、正解率89%で抽出できることを確認。同社は、「この精度は実用水準といわれる正解率90%に迫る高い精度だ」と説明している。

文書理解AI技術の性能評価 文書理解AI技術の性能評価[クリックで拡大] 出所:東芝

 同社は、今回のインフラ文書理解AIの実用化に向けた取り組みの第一段階として、2024年に同社グループ内の事業現場での運用開始を目指している。なお、一般へのサービス提供開始時期については、現時点では開示していない。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.