「世界トップレベルの日本語性能」、NECの独自LLM:生成AI事業、3年で売上高500億円指す(1/2 ページ)
NECが、軽量でありながら「世界トップレベルの日本語性能」(同社)を有する独自LLM(大規模言語モデル)を開発した。同社は2023年7月から法人向けの生成AIサービスを順次提供し、3年で売上高500億円を目指すという。
NECは2023年7月6日、生成AIに関する取り組みについて説明会を開催。独自に開発した、軽量でありながら「世界トップレベルの日本語性能」(同社)を有するLLM(大規模言語モデル)や、2023年7月から順次提供を開始する法人向けの生成AIサービスについて説明した。同社は今後3年間で、生成AI関連事業として売上高500億円を目指すという。
社内に生成AI専門組織を新設
説明会には、NECの最高デジタル責任者(CDO)である吉崎敏文氏らが登壇した。吉崎氏は同社の生成AI事業について「社内ではコードネーム『G2』として構想には4年、LLMの開発には2年の時間をかけた。全社を挙げて取り組んでいる」と述べた。
同社では2023年5月から生成AIを社内業務に利用していて、すでに「資料作成時間を50%削減」「議事録の作成時間を平均30分から約5分に短縮」「社内システム開発におけるソースコード作成業務の工数を80%削減」といった成果を上げているという。
同社は2023年7月1日、生成AIの専門組織「NEC Generative AI Hub」をCDO直下に新設した。同組織には研究者やプロンプトエンジニア、コンサルタントなどの専門人材が参加する。同組織のリーダーを務めるNEC Generative AI Chief Navigatorの千葉雄樹氏は「NECのアセットを結集させて顧客の役に立つ生成AIサービスを提供し、NECの成長をけん引する」と意気込みを語った。
生成AIに関する具体的な事業としては、日本市場のニーズに合わせた専用ハードウェア/ソフトウェア、コンサルティングサービスなどを法人向けに提供する「NEC Generative AI Service」を2023年7月から順次開始する。
また、NEC独自のLLMも開発した。パラメーター数を130億に抑え、外部のネットワークとつながっていないオンプレミス環境でも動作可能なほど軽量でありながら「世界トップクラス」(同社)の日本語能力を有するという。
130億パラメーターで日本語能力は「トップレベル」の独自LLM
NECが開発したLLMは、日本語言語理解ベンチマーク「JGLUE」を用いた評価で、知識量を計測する質問応答では正答率81.1%、推論能力を計測する文書読解では正答率84.3%と、日本語の文書読解能力は「世界トップレベル」(同社)だという。
一方、パラメーター数は130億と海外の主要なLLMと比べ小規模だ。パラメーター数を抑えたことで運用時のサーバコストや消費電力の抑制、レスポンスの高速化が見込めるという。また、GPUを1枚のみ搭載した一般的なサーバでも動作可能で、オンプレミス化により秘匿性の高い業務でも活用を見込む。同LLMをベースに個社向けにカスタマイズしたモデルも短期間で作成できるという。
今回のLLM開発でリーダーを務めたNECデータサイエンスラボラトリー主幹研究員の小山田昌史氏は「海外のトップLLMは1750億パラメーターだ。動かすにはGPUが8枚以上必要で、気軽には使えない。NECのLLMはパラメーター数はその13分の1で、最低1枚のGPUで動作する。業務用の標準的なスペックのPCやゲーミングPCでも動く」と軽量さを強調した。
軽量化と高い日本語能力の両立は、学習データを増やす戦略によって実現した。一般的にLLMの性能はパラメーター数(運用コスト)と学習データ量(学習コスト)の掛け算で決まるが、小山田氏は「各社はパラメーター数を増やすことで性能の向上を試みてきた。NECでも当初パラメーター数を大きくする計画だったが、業務で使えるように普及させるためには運用コストを小さくできないかと思い立ち、パラメーター数を減らして学習データ量を大幅に増やした」と説明した。学習データとしては、同社が独自に収集した日本語や英語などのデータを用いたという。
NEC独自のLLMのデモでは、NECのプレスリリースを箇条書きで要約させる活用例を紹介していた。
NECは、今後の方針として、顧客の社内データを定期的に学習させることで最新知見を備えた個社向けモデルを継続的に提供することを考えているという。
Copyright © ITmedia, Inc. All Rights Reserved.