fbpx

CL LAB

HOME > CL LAB > Neo4j > グラフからナレッジグラフへ:データの動向と課題 #Neo4j #ナレッジグラフ

グラフからナレッジグラフへ:データの動向と課題 #Neo4j #ナレッジグラフ

 ★ 0

本ブログは 「Neo4j」 社の技術ブログで2021年10月21日に公開された「 From Graph to Knowledge Graph: Data Trends and Challenges 」の日本語翻訳です。

企業が競争力を高めるためには、ナレッジが持つ力を引き出すことが不可欠です。

多くの企業は、情報をすべてつなぎ合わせナレッジとすることを重要視しています。しかし、データをナレッジに変換するテクノロジーは、まだまだ発展中と言えるでしょう。データランドスケープの多くはまだ成熟度が高くありません。

すべてのシステム、クラウド、バックアップ、およびデータレイクを横断して、データをつなぐ方法が必要です。リアルタイムでクリーンなデータをダッシュボードに表示したり、ビジネスプロセスに情報を提供したりと、データパイプラインが充実している場合もありますが、これだけでは十分ではありません。このような成功体験があらゆる場所で再現されなければなりません。

今こそ、データを管理しやすく、使いやすいようにつなげる必要があります。業務を遂行するうえでデータを必要とする社員だれもが、どこにデータがあるかを把握し、その正確さに自信を持ち、自分で容易に課題解決できる必要があります。

このブログでは、データのトレンドと課題についてご紹介します。

データサイロ

まず、データのサイロ化が挙げられます。データストアやアプリケーションは、多くの場合、個別のグループや部署を対象としています。営業部はSalesforceなどのプラットフォームを使用し、人事部は別のプラットフォームを使用している、というようなことが多々あります。記録システムはデータを維持・管理し、ガバナンスポリシーを確立するために重要ですが、データサイロによって分析のスピード、レポートの正確性、データの質が低下します。

データスプロールとデータレイク

ほとんどの組織では、データレイク、データウェアハウス、リレーショナルデータベースなどで、記録システム、顧客データ、取引データ、製品データ、注文データなど、数えきれない程の種類のデータを保管しています。このようなデータの散乱は、データスプロール(増殖)の原因となります。

データレイクは、構造化データ、半構造化データ、および非構造化データを大量に保存するための低コストな手段として人気があります。データレイクの構築には、Amazon S3などのオブジェクトストレージがよく使われます。

コスト面でも魅力的なデータレイクですが、アプリケーションやサービスで生成されるログファイルなど、あらゆる種類のデータを保存できるというメリットもあります。データレイクにデータを保管するのは非常に簡単で便利なのです。しかしその反面、データの管理やそもそもどんなデータが入っているのか把握することが困難になってきます。

クラウドストレージ

クラウドコンピューティングは革命的でありながらも、より多くのデータがより多くのシステムに保存されるため、ガバナンス上の課題が残っています。個人的なクラウドデータでも、iCloud、Google Drive、Dropboxのほか、Evernote、Gmail、Notesなどに散らばっているケースが多いでしょう。

これにより私たちは、異なる形式の、冗長でばらばらなデータを大量に抱えることになるのです。

コンプライアンス観点でいうと、乱雑なデータは最悪です。

GDPR対応の一環として、ある人のデータを消す必要があったとして、その人のデータがすべてどこにあるかを特定できますか?その人と紐づいていると気づけないクッキーなどはないでしょうか?自社の物流システムやパートナーのシステムにあるデータについてはどうでしょう?

過去のデータが価値を無くす時

過去のデータは、機械学習による予測を促進します。しかし、新型コロナウイルス感染症の流行により、過去のデータが役に立たなくなり、経済は大きな打撃を受けました。

過去のデータは通常、購買行動を予測するために使用されますが、パンデミックの影響で購買行動は一夜にして変化し、オンラインショッピングが市場を席巻するようになりました。このような消費者行動の劇的な変化により、過去のデータでは購買行動を正確に予測することができなくなりました。

データが限られている時、データのつながりの重要性と価値が増します。グラフデータベースにデータを入れることでつながりや関係性を把握することができます。

関連する過去のデータがない場合でも、データ内に存在する関係性を把握することで予測能力を高めることが可能です。それは、つながりおよび関係性が、データの持つ、予測に最も役立つ要素だからです。

これらの要因により、今多くの企業が、データをグラフデータベースでつなげ、ナレッジを得る方向に進んでいます。

ナレッジグラフの力を発揮し、企業の競争力を高める方法について詳しく知りたい方は、
「グラフからナレッジグラフへ:無限の洞察への旅」を無料でダウンロードできます。

ホワイトペーパーのダウンロードはこちら

New call-to-action

New call-to-action

CL LAB Mail Magazine

CL LABの情報を逃さずチェックしよう!

メールアドレスを登録すると記事が投稿されるとメールで通知します。

メールアドレス: 登録

※登録後メールに記載しているリンクをクリックして認証してください。

Related post

[無料ウェビナー] GitLab_CI/CDハンズオン_2023111