東芝と東北大学東北メディカル・メガバンク機構、東北大学病院および、情報通信研究機構は、量子暗号通信技術と秘密分散技術を組み合わせたデータ分散保管技術を開発、この技術を用いゲノム解析データを複数拠点に分散し安全に保管する実証実験に成功した。
東芝と東北大学東北メディカル・メガバンク機構(ToMMo)、東北大学病院および、情報通信研究機構(NICT)は2021年8月、量子暗号通信技術と秘密分散技術を組み合わせたデータ分散保管技術を開発、この技術を用いゲノム解析データを複数拠点に分散し安全に保管する実証実験に成功したと発表した。
ゲノム解析データは大容量で機密性が高い。長期にわたりデータの漏えいや改ざんを防ぐため、バックアップ用データはこれまで、ディスクやテープなどのメディアに保存し、遠隔拠点に保管するなどの方法を用いていた。一方で、バックアップに必要なコストの削減や利便性/可用性の確保なども課題となっていた。
開発したデータ分散保管技術は、あらゆる盗聴や解読に対して、安全な暗号通信を可能にする「量子暗号通信技術」と、原本データを無意味な複数のデータ片(シェア)に変換することで、データを安全に保管できる「秘密分散技術」の2つを組み合わせた。これによって、データの「通信」と「保管」の両面で、情報理論的安全性を担保することが可能となった。
ゲノム解析データを分散保管し、復元する方法はこうだ。データ保管時は、「XOR閾(しきい)値秘密分散法」と呼ばれるアルゴリズムを用い、複数のシェアに分散する。各シェアは、量子鍵配送により生成、蓄積した暗号鍵を用いる「ワンタイムパッド暗号通信」で異なる複数拠点に送信され、分散保管する。
データを復元する場合は、分散保管されている拠点から、ワンタイムパッド暗号通信を用いて各シェアを1つの拠点に集める。その上で、XOR閾(しきい)値秘密分散法アルゴリズムを用い、元のゲノム解析データを復元する処理を行う。
特に今回、高速にシェアデータの読み書きを行う「ダイレクトアクセス技術」や、ワンタイムパッド暗号を高速に実行する「並列ソフトウェア技術」を用いた。これにより、情報理論的安全性を確保しながら、大量のデータを実用的な時間内に分散保管することが可能となった。
研究グループは、東芝ライフサイエンス解析センター(LSA)やToMMo、東北大学病院と、宮城県仙台市内にある3つの拠点を活用して、開発した分散保管技術の実証実験を行った。具体的には、NICTが開発した秘密分散技術を用い、ToMMoがゲノム解析データを「シェアA」「シェアB」「シェアC」と3つに分散した。シェアAはToMMoで保管。そして、東芝が開発した量子暗号通信技術を活用し、シェアBは東北大学病院に、シェアCはLSAに伝送され、それぞれが保管した。オリジナルの解析データを復元する時には、3つあるシェアのうち2つをToMMoの拠点に集めて復元した。
1検体のゲノム解析データ(約80Gバイト)を用いて実証実験を行った結果、分散保管処理には約30分(356Mビット/秒)、復元処理には約21分(502Mビット/秒)の時間を要することが分かった。ToMMoにおける最小バックアップ単位(100検体)で試算すると約50時間になるという。
東芝は引き続き、医療や金融、政府機関、通信インフラなどの用途で量子暗号通信技術の実用化を進めていく考えである。
Copyright © ITmedia, Inc. All Rights Reserved.