IBMがビッグデータ解析のビジネスに力を入れている。同社は、クラウドサービス向けのデータ処理プラットフォームとして「Apache Spark」を採用すると発表した。3500人の研究員を投入する一大プロジェクトになりそうだ。さらに、100万人のデータサイエンティストを育成することも発表している。
IBMはかつて、Linuxを商用オープンソースOS(オペレーティングシステム)に位置付けた。そして今度は、オープンソースのビッグデータ処理向けの汎用エンジン「Apache Spark」で同じことをする計画だという。
IBMの分析プラットフォーム部門でゼネラルマネジャーを務めるBeth Smith氏は、米国サンフランシスコで開催されている「Spark Summit 2015」(2015年6月15〜17日)の基調講演で、IBMのクラウドサービス向けのデータ処理プラットフォームとしてApache Sparkを組み込むと発表した。さらに、100万人以上のデータサイエンティストを育成することも明らかにしている。
Apache Sparkは、インメモリで高速に分散処理ができるエンジンだ。よく使用するデータを、マスストレージデバイスではなく、インメモリに保持することで、迅速に繰り返しアクセスできるようにするため、機械学習のようなスマートアプリケーションに適している。オープンソースのソフトウェアプロジェクトを支援する非営利団体である「Apacheソフトウェア財団(ASF)」によると、「Apache SparkはASFが支援する最も活発なプロジェクトで、2014年だけで465件以上の適用事例があった」という。
EE TimesはSpark Summitの基調講演に先立って、Smith氏に対するインタビューを行った。同氏は、「IBMは、Apache Sparkを基盤技術プラットフォームとして、あらゆる事業に関連する分析を抜本的に改革する計画だ。Apache Sparkは、当社のユーザーデータ戦略を推進し、事業の改革と差別化をもたらすと期待している」と語った。
Copyright © ITmedia, Inc. All Rights Reserved.