saitoxu.io

AboutTwitterGitHub

推薦システムの研究の問題設定

June 26, 2021

推薦システムに関する研究は多くありますが、その問題設定にはいくつか種類があります。
今回はサーベイ中に見つけた主要な問題設定を5つ紹介します。

  1. Basic Recommendation
  2. Sequential Recommendation
  3. Session-based Recommendation
  4. Cross-domain Recommendation
  5. Multi-behavior Recommendation

1. Basic Recommendation

最初は最も基本的な問題で、これはアイテムに対するユーザーの評価履歴がある場合に、そのユーザーの未評価のアイテムの評価値を予測するというものです。予測した評価値の降順に、ユーザーにアイテムを推薦します。
Basic Recommendationという名称ですが、実際に論文などでこのように呼ばれているわけではなく、今回便宜上つけた呼称です。

たとえば、映画評価サイトでユーザーがいくつかの映画に対し5段階評価をつけている状況で、そのユーザーに対し、そのユーザーがまだ評価していない映画を推薦するというような状況がこの問題に該当します。

データとして必要なのはユーザーの過去の評価値だけで、問題もシンプルなので最も考えやすい問題設定と思います。
ただ、このような基本的な問題設定では解決できない、現実のアプリケーションにおける問題(e.g. コールドスタート問題)や、モデル化の際に破棄してしまっているデータや設定を加えることでより良い推薦ができるのでは、という考えがあって、後述するような問題設定における研究が進められています。

2. Sequential Recommendation

2つ目はユーザーの評価履歴の順序を考慮した推薦です。
Basic Recommendationでは評価履歴の順序を考慮していませんでしたが、実際はユーザーの興味関心は移り変わりゆくものであり、評価値をつけた順序をモデルに組み込めればより良い推薦精度に繋がるだろうと予想されます。
そこで、Sequential Recommendationでは過去の評価値の系列から、将来どのアイテムにどういった評価値をつけるかを予測します。

3. Session-based Recommendation

3つ目はSequential Recommendationと同様にユーザーの行動順序を考慮しますが、より短い期間(セッション)でのユーザーの興味関心の変化等を捉え、そのセッション中、または将来のセッションで高評価をつけるであろうアイテムを予測し推薦します。
セッションの期間は数分から数時間という長さが一般的のようです。

Sequential Recommendationと似ている問題設定ではありますが、セッション中のアイテムの共起、つまり同一セッションで評価されたアイテムは何らかの関係があるだろう、などの点に着目することでSequential Recommendationとは異なる研究の広がりを見せています。

比較的最近にサーベイ論文が発表されていたのでリンクを貼っておきます。
Shoujin Wang, Longbing Cao, Yan Wang, Quan Z. Sheng, Mehmet Orgun, Defu Lian. “A Survey on Session-based Recommender Systems” [arXiv’19]

4. Cross-domain Recommendation

4つ目は問題設定というより手法に近いところもありますが、Cross-domain Recommendationというテーマがあります。
これはユーザーにアイテムを推薦したいドメイン(ターゲットドメインという)において、別のドメイン(ソースドメインという)で得られた知識を有効活用しようというものです。
機械学習における転移学習のような考えに近いと思います。

たとえば、本のECサービスが元々あったとして、そこで得られた購買データを音楽のECサービスの推薦に活かすというのが考えられます。
2つのドメインのユーザーやアイテムの重なり具合がどうだと良いのか、ドメインの組み合わせをどうしたらよいかなど、Cross-domain Recommendation特有の問題があり、かつまだまだ研究の余地がある領域なので今後面白い分野だと思います。

5. Multi-behavior Recommendation

最後はMulti-behavior Recommendationで、文献によってはMulti-relational Recommendationとも呼ばれたりします。
これはユーザーとアイテム間に複数のインタラクションの種類がある場合の推薦で、複数種類のインタラクションを活用し、アイテム毎にターゲットのインタラクションを行う確率を予測し、そのスコアが高いアイテムを推薦します。

たとえば、ECサイトにおけるアイテム推薦では通常購買データを使って推薦を行いますが、Multi-behavior Recommendationでは購買データ以外にアイテムの閲覧データや、お気に入り・カートの履歴など複数のインタラクションデータを使って購買の予測に役立てます。

ECサイトに限らず、実際のアプリケーションではユーザーが複数のインタラクションを実行できるのは一般的なので、基本的な推薦問題に比べより現実に即した問題設定と言えるでしょう。


以上、5つの問題設定を紹介しました。
推薦システムの研究を知る足がかりとして参考になれば幸いです。


© 2021, Yosuke Saito