Gartner Cloud DBMS Report Names MarkLogic a Visionary

エンタープライズNoSQLによるSNL40アプリ

2015年5月14日の「ハリウッドITサミット(HITS)」において、NBCエンターテインメントデジタル社テクノロジー&オペレーションズ部門の製品担当SVP(当時)であるマイケル・マーティン氏は、このTVネットワークで最も有名かつ人気のある「サタデー・ナイト・ライブ」用のアプリを開発し、ファンとの繋がりを再発明したユニークな体験について発表しました。

このテレビ局のデジタルチームは、「サタデー・ナイト・ライブ40周年記念番組」の際に、長年にわたってこの番組が生み出してきた素晴らしいコンテンツを使って「何か特別なこと」をやりたいと考えました。この特番は、過去10年における娯楽番組の生放送のなかでも最も成功したものとなり、各時代からのベストコンテンツがフィーチャーされました(70年代のBass-o-matic、80年代のWayne’s World、90年代のCelebrity Jeopardy、そして2000年代のDigital Shortなど)。

マーティン氏のチームの調査においても、こういった幅広いコンテンツの存在が重要な位置を占めていました。つまり誰でもこの番組を知っていて、長年にわたるさまざまなコンテンツについても詳しいのです。またほとんどの人は、自分にとってのこの番組の「黄金時代」があります。ここで問題となるのは、この番組には長い歴史があり、クオリティもずっと高かったので、一人一人の「黄金時代」が違っているということです。一方、この番組は多くの人々および幅広い世代に受け入れられていますが、オンラインで視聴されているのは最近のものがほとんどです。また、この番組の多くは何らかの形でネット上に存在していましたが、視聴者は自分が好きなコンテンツをなかなか見つけられませんでした。マーティン氏のチームは、この問題解決のためにユニークなデジタル体験を提供することにしました。彼らが考えたのは、単に「すべてのファンにすべてのコンテンツを提供する」だけではなく、SNLコンテンツの視聴において全く新しい体験を提供できるようなアプリでした。


データによるエクスペリエンスの促進

このチームは、まず最大の課題に取り組む必要がありました。ここでの最大の課題とは「エクスペリエンス(体験)を促進するデータ」のことです。それまでSNLのオンライン視聴回数があまり多くなかった理由の1つとして、メタデータでコンテンツ自体をきちんと提示できなかったことがあります。最も信頼性の高いデータは、日付/タイトル/キャラクターです。しかしこれらのデータだけでは十分ではありません。というのもジョークのオチがわからないようなタイトルをわざと付けていたり(「CPR Class」など)、名前が不明なキャラクターがいたり(ドゥニース・マハレルって誰だかわかりますか?)、また放送時期をはっきりと覚えていない人も多かったからです。

マーティンのチームがやらなければならなかったのは、この番組に関してみんなが「知っている」こと(全キャラクター/キャストメンバー/シーズン/物真似/スケッチ/各アイテムの特徴など)を捕捉することでした。こういったデータをまとめることでこの番組の世界が形成されると、お気に入りコンテンツを探しやすくなります。ドゥニース・マハレルの例で言うと、彼女の「手が小さいこと(「tiny hands」)」や、彼女は「ザ・ローレンス・ウェルク・ショー」というシリーズに登場していることなどが重要です。この番組のデータの世界では、こういった情報をまとめて新しいエクスペリエンスを提供する必要がありました。有名な例としては、このHITSカンファレンスでマーティン氏が取り上げたサラ・ペイリンがあります。「サラ・ペイリン」はキャラクターであり(ティナ・フェイが演じるところの)、ゲストであり(本人が40周年記念番組に出演)、 またキャストメンバーでもあります(サラ・ペイリンを物真似するティナ・フェイを物真似するキャストメンバー)。こういった別個のコンセプト(キャラクター/ゲスト/キャストメンバー)をすべて捕捉して整理することで、探しているスケッチが見つけられるようにしなければなりません。これを番組内のすべてのコンセプトとテーマに対して行わなければならなかったのです。


「疎なデータ」が差別化要因

従来のRDBMSでこのようなデータを扱う場合、すべてのビデオクリップをレコード化し、各アイテムごとにタグを付けます(Character = Dooneese Maharelle, Characteristic = tiny hands, Cast member = Kristen Wiigなど)。クエリでそれぞれのタグを利用することで、サラ・ペイリンのレコードから探していたクリップを提示するには、かなりのデータモデリングが必要です。「疎なデータ(sparse data)」は不便であり、使用されないことが多いです。というのもそれぞれのクリップごとに「小さなデータ世界」が次々と生み出されてしまうからです。このため、他の方法が必要でした。

ここで、このSNLチームは「スマートコンテンツ」に目を向けました。これはメタデータとセマンティックを一緒に使用するデータモデリング手法です。これにより「この番組の世界」が、セマンティックオントロジーで表現されます。つまり各キャラクターがコンセプトとなり、各キャラクター(サラ・ペイリンからドゥニース・マハレルまで)およびそのすべての特徴は別個のセマンティックデータとして管理されます。これはこの番組を表現するために集められた、キャストメンバー、シーズン、テーマ、またそれ以外の数多くの種類のデータの場合でも同様です。各レコードにはメタデータレコードがありますが、メタデータでは大量のフィールドを持つ代わりに、コア情報(日付とタイトル)とセマンティックトリプル(この番組の世界におけるこのクリップの位置付けを表現する)があります。

data relationships

オントロジーのスナップショット。関係性のグラフを表している

 

このデータを活用するために、このチームはMarkLogicのエンタープライズNoSQLデータベースを採用しました。MarkLogicでは、オントロジーはセマンティックトリプルとして格納され、メタデータレコードはオントロジーにリンクされた組み込みトリプルを含むドキュメントとして格納されます。ドキュメントとセマンティックデータを組み合わせることにより、SNLの40周年記念アプリの検索とクエリが強化されました。


セマンティックによるリコメンデーションの促進

MarkLogic内にデータを持ち、これに対してダイナミックにクエリを実行できるので、このチームは「自分たちが考えているようにユーザーにコンテンツを体験させられるのか」という大きな課題を解決できました。このアプリでは、最初に検索/ブラウズさせるのではなく、まずシンプルにビデオを流して、そのお薦めビデオからユーザーが移動していく仕組みにしています。最初に的確なビデオを提示することがユーザーの第一印象には重要なため、優れた予測エンジンが必要でした。この番組の世界を表現したセマンティックデータにより、適切である可能性が高いクリップをまとめることができます。ここでこのチームはさらに上を目指し、番組の全データだけでなく、各ユーザーの視聴イベントもセマンティックトリプルとして記録しました(これを匿名的に、あるいはユーザーのプロフィール&お気に入りの一部として行います)。

ダイナミックにパーソナライズされたリコメンデーションを実現するため、セマンティックデータ/ユーザー情報/メタデータをクエリし、トランザクションによりデータの一貫性を担保し、大規模拡張時にも複雑な演算処理が可能なMarkLogicを活用しています。この結果、このアプリでは各ユーザーごとのダイナミックなリコメンデーションだけでなく、現在進行中のセッションにおけるユーザーの挙動に応じて随時新しいリコメンデーションを表示できるようになりました。

ハリウッドITサミットでの発表の締めくくりとして、マイケル・マーティン氏はこのSNLの新規アプリがどのくらい成功したのかについて話しています。このアプリは1200件の記事に取り上げられ、世界中の視聴者に対して1億点以上のビデオを提供しています。これにより、この番組に対するファンのエンゲージメントが大幅に強化されました。またユーザーの視聴行動も変化しました。マーティン氏によると、ファンは「1つだけ見て終わり」ではなく没入するようにビデオを見ており、視聴時間が長くなっています。つまりSNLをじっくりと楽しむようになっています。

このように素晴らしいコンテンツに関するユーザーエクスペリエンスを変革したNBCデジタルエンターテインメントチームは、次に何をするのでしょうか。 マーティン氏とそのチームしか知らないことでしょうが、昔のアプリ体験のようにはならないことは間違いないでしょう(本ブログは当初2015年に発表されたものです)。

 

Matt Turner - Chief Technology Officer - Media Publishing | MarkLogic

Matt Turner is the CTO, Media and Manufacturing at MarkLogic where he develops strategy and solutions for the media, entertainment and manufacturing markets. Matt works with customers and prospects to develop MarkLogic enterprise NoSQL operational data hubs that enable them to get the most of their data and deliver their products to the fans, audiences and customers that love them.

Before joining MarkLogic, Matt was at Sony Music and PC World developing innovative information and content delivery applications.

Start a discussion

Connect with the community

STACK OVERFLOW

EVENTS

GITHUB COMMUNITY

Most Recent

View All

Digital Acceleration Series: Powering MDM with MarkLogic

Our next event series covers key aspects of MDM including data integration, third-party data, data governance, and data security -- and how MarkLogic brings all of these elements together in one future-facing, agile MDM data hub.
Read Article

Of Data Warehouses, Data Marts, Data Lakes … and Data Hubs

New technology solutions arise in response to new business needs. Learn why a data hub platform makes the most sense for complex data.
Read Article

5 Key Findings from MarkLogic-Sponsored Financial Data Leaders Study

Financial institutions differ in their levels of maturity in managing and utilizing their enterprise data. To understand trends and winning strategies in getting the greatest value from this data, we recently co-sponsored a survey with the Financial Information Management WBR Insights research division.
Read Article
This website uses cookies.

By continuing to use this website you are giving consent to cookies being used in accordance with the MarkLogic Privacy Statement.