リコー デジタルサービスビジネスユニットAIサービス事業本部デジタル技術開発センターのLMM開発室で室長を務める長谷川史裕氏は「日本のビジネス文書は複雑なロジック構造で、読み解くには複数ステップの推論や、図表をまたぐ推論など高度な推論能力が求められる。リコーはテキストや画像など複数種類のデータを同時に処理できるLMMで、日本のビジネス文書向けのAIモデルを作ってきた。GENIAC第3期ではリーズニング性能を強化し、より複雑なドキュメントをより高精度に理解できるようにした」と語る。
新モデルではVQA(Visual Question Answering:画像に関する質問に回答させるタスク)の選定、SFT(Supervised Fine-Tuning:教師ありファインチューニング)、独自の報酬関数を用いた強化学習の3ステップで学習を行う。肝となるのが強化学習で、模範解答と生成した回答の一致度だけでなく、推論過程を出力することや、出力に日本語を使うことも報酬関数に組み入れることで、信頼性を向上させている。
個社向けチューニングによる精度の向上や、独自の画像トークン圧縮技術での運用コスト低減も実現した。長谷川氏は「オンプレミスAIながら『Gemini2.5-Pro』など大型商用モデルと同等のベンチマーク結果を確認でき、社内文書への活用が現実味を帯びてきた」と語る。
「2026年6月には、Hi.DEENプラットフォームでオンプレミススターターキットの提供を開始する予定だ。このLMMを使えば、蓄積した社内データをもとにした設計改善や、顧客アプローチ方法などの壁打ちができる。いわば会社の先人たちと議論を交わすことができる」(長谷川氏)
半導体工場でのAI活用をグローバル展開 GFが示す道筋
米国がAIチップの対中輸出を再開 米中は「管理された相互依存」に
AI PCでクラウド×ローカルの「ハイブリッドAI」実現
「基盤は整った」 現場で学ぶオンデバイスAI、ロームが展開加速
エージェントAIをエッジに簡単実装 NXPが開発ツール刷新Copyright © ITmedia, Inc. All Rights Reserved.
記事ランキング