YouTubeのAIアルゴリズムを解説:レコメンデーションの仕組み

内容

YouTubeのAIレコメンデーションの仕組み

YouTubeのAIアルゴリズムとは?

YouTubeのAIアルゴリズムは、ディープラーニングによる推薦システムで、各人が次に何を見る可能性が高いか、どれくらい見続けるかを予測し、その予測を使ってYouTube全体で動画の提案をパーソナライズする。.

コア・アイディア

YouTubeは、視聴者の行動から学び、満足度を予測することで、世界規模でレコメンデーションをパーソナライズしている。中心的な目標は、セッション、つまり1回の訪問で誰かが視聴する総時間を長く保つことだ。クリックは重要だが、クリック後のリテンションはもっと重要だ。.

仕組み

YouTubeでは一般的に2段階のアーキテクチャを採用している。まず候補を生成し、ユーザーにマッチしそうな動画の幅広いセットを引き出し、次に予測される結果によってそれらの動画をランキング順に並べる。モデルは、視聴時間、スキップ、再視聴などの大量の暗黙のフィードバックでトレーニングされる。システムは訓練サイクルと実験を通じて継続的に更新される。.

使用場所

ホーム、アップ・ネクスト、サーチ・オーダー、ショーツなど、複数のサーフェスには同じ基本的なアプローチが採用されている。各サーフェスには、セッションの開始、セッションの延長、クエリへの回答など、少しずつ異なる目的がある。ライブ・レコメンデーションは、現在の視聴率のようなリアルタイムのシグナルを取り入れることもできる。.

対象者

このコンセプトは、特定の動画を見る理由を理解したい日常の視聴者や、持続的な発見を望むクリエイターにとって重要である。マーケティング担当者は、配信やトピックの戦略立案にこれを利用する。AIの専門家は、大規模な現実世界のレコメンダーシステムとして研究している。.

YouTubeの推薦が重要な理由

YouTubeは、単一のマジックルールで動画を選別しているわけではありません。YouTubeは、プラットフォーム全体の行動から学習する大規模な機械学習システムを稼働させており、その学習を使ってトップページ、Up Nextサジェスト、検索結果、Shortsフィードなどを形成している。.

を超える。 月間アクティブユーザー27億人 そして 毎分500時間以上の動画がアップロードされている (Statista、2023年)、YouTubeは人間のキュレーションに頼ることはできない。レコメンデーション・システムは、このプラットフォームが使い続けられる理由であり、アルゴリズムが、何が発見され、どのクリエイターが成長するかに多大な影響力を持つ理由でもある。.

歴史的背景:YouTubeレコメンデーションの進化

初期(2010年以前):ビュー、クリック、基本的な協調フィルタリング

初期の時代、レコメンデーションシステムは比較的単純だった。人気や「Xを見た人はYも見ている」というロジックに大きく依存していた。これはライブラリーが小さかったときには有効だったが、浅いクリックに最適化するインセンティブを生み出すことにもなった。.

  • 視聴回数とクリック数
  • 基本的な協調フィルタリング(Xを見た人はYも見ている)
  • 幅広い人気シグナル

ウォッチタイムへのシフト(2012年~2016年):“視聴 ”から “満足 ”へ”

大きな転機は、YouTubeがその主要な指標を再生回数から視聴時間に移行したときに訪れた(Think with Google, 2012)。核となる洞察は単純で、高いクリックスルー率は、視聴者がすぐに動画を放棄した場合でも良く見える。.

  • クリックスルー率(CTR)が高くても、閲覧者がすぐに離脱してしまえば誤解を招きかねない。.
  • 視聴者を飽きさせない動画は、クリック数だけよりも強い満足度のシグナルとなる。.
  • クリックは依然として発見を助けるが、クリック後のリテンションが中心となった。.

YouTubeスケールでのディープラーニング(2016年以降)

2016年、Google AIは「Deep Neural Networks for YouTube Recommendations」を発表し、行列因数分解のような古いアプローチからディープニューラルネットワークへの移行について説明した。これにより、パーソナライゼーションの質が向上し、システムが疎な暗黙のフィードバックから学習するのを助け、YouTubeのスケールと急速なコンテンツ速度をサポートした。.

連続的反復:多くのモデル、一定の実験

YouTubeのアルゴリズムは静的なものではありません。継続的なモデルの改善、A/Bテストのインフラ、関連性と多様性のバランスをとるチューニングによって、継続的に更新されています。また、コミュニティガイドラインに違反したコンテンツの降格など、ポリシーと安全システムも統合されている。.

Think with Google」(2023年)、「The Verge」(2023年)、「Hootsuite」(2023年)などのソースからの公開説明は、共通して同じテーマを強調している:レコメンデーションは、多くのモデル、多くのシグナル、絶え間ない測定から生まれる。.

YouTubeのAIアルゴリズムの仕組み

バックボーンとしてのディープ・ニューラル・ネットワーク

YouTubeのレコメンダーは、ディープラーニングを利用している。ディープラーニングは、機械学習のサブセットで、多層ニューラルネットワークを使用して、大規模なパターンを認識する。ディープラーニングが特に効果的なのは、データが膨大で、フィードバックが明示的な評価ではなく暗黙的なもの(視聴、スキップ、一時停止)であることが多く、ユーザーとコンテンツの関係が複雑で常に変化している場合だ。.

YouTubeのインタラクション・データは、レコメンダー・システム的な意味で「スパース」だからだ。無数の動画があり、その多くはカタログのサイズに比べると比較的少ないインタラクションしかない。.

二段階検索システム:候補の生成とランキング

膨大な量のライブラリから効率的に推薦するために、YouTubeは一般的に2段階のシステムを採用している。第一段階では、関連する可能性のある動画を幅広く探し出し、第二段階では、どの動画を最初に表示するかを選択する。.

候補者生成ネットワーク(高リコール)

  • 目的 高い想起率で潜在的に関連性のあるビデオの幅広いセットを生成する。.
  • インプット: 視聴履歴、検索クエリ、購読チャンネルなど、ユーザーの過去のアクティビティ。.
  • メカニズム 学習された表現は、ユーザーの興味にマッチしそうなビデオを検索する。.

この段階は、広く網をかけるように設計されている。通常、最終的なリストではなく、数百人の候補者を返します。.

ランキング・ネットワーク(高精度)

  • 目的 候補者のビデオを高精度で採点し、注文する。.
  • インプット: 候補のビデオに加え、時間帯、デバイス、最近の行動など、より豊かなコンテキストを提供。.
  • 予想ターゲット 予想視聴時間、セッション視聴時間、さらに「いいね!」、コメント、“興味なし ”などのエンゲージメントシグナル。”
  • 出力: ホーム、次へ、その他の表面に表示される、洗練された順序付きリスト。.

実用的なメンタルモデル: 候補者の世代は、検討する価値のあるものを決定し、ランキングは、最初に見せる価値のあるものを決定する。.

ベクトルの埋め込み数学形式の類似性

YouTubeは、ユーザー、ビデオ、検索クエリの数値表現である埋め込みベクトルに大きく依存している。.

  • ユーザー埋め込み: 時計の履歴とインタラクションパターンに基づいて嗜好を表す。.
  • ビデオの埋め込み: トピック、スタイル、視聴者の反応など、コンテンツの特徴を表現する。.

エンベッディングにより、システムはユーザーとビデオを高次元空間で比較することができる。たとえ同じクリエイターや同じキーワードのような明白な表面的特徴を共有していなくても、その空間で近いアイテムは類似しているものとして扱われます。これが、YouTubeが明示的な検索がなくても関連性の高いコンテンツを推薦できる理由のひとつである。.

YouTubeがパーソナライゼーションに使うシグナル

パーソナライゼーションはこのシステムの核心だ。YouTubeは、誰かがクリックするかもしれないものだけでなく、彼らが実際に見続けるものを予測しようとしている。.

ユーザー・インタラクション・シグナル(明示的および暗黙的)

腕時計の歴史(しばしば最強の単一シグナル)

視聴履歴は実際の行動を捉えているため、一般的に最も強いシグナルのひとつとして扱われる。一般的に、最近の視聴は古い視聴よりも重要であり、あるトピックやクリエイターへの関心が繰り返されることで、その嗜好性が強まる。.

  • 再帰性: 最近の活動は、より重要な意味を持つ。.
  • 頻度: 繰り返されるパターンは嗜好を強化する。.

検索クエリー

検索は明示的な意思表示である。もし誰かが “DIY home repair ”と検索したなら、システムは彼らが普段見ているものだけでなく、今何を欲しているのかについて強い手がかりを持っている。.

チャンネル登録

サブスクリプションは、特定のクリエイターへの関心を示す明示的なロイヤリティ・シグナルである。サブスクリプションはレコメンデーションに影響を与えるが、それを完全にコントロールすることはできない。.

エンゲージメント指標

YouTubeは、異なる意味と重みを持つさまざまなエンゲージメントシグナルを使用している。視聴時間は中心的なものだが、その他のシグナルによって、品質、満足度、意図に関するシステムの理解を深めることができる。.

  • 時計の時間とセッションの時間: 最重要指標として扱われることが多い。.
  • 好き嫌いがある: 明示的な肯定的または否定的なフィードバック(嫌いなものは依然として相互作用データとして機能する)。.
  • コメント より深い関与と地域社会との交流の証。.
  • “「興味がない」というフィードバック: 似たような内容を避けるよう明示的に指示。.
  • クリックスルー率(CTR): 最初の発見には便利だが、クリック後のリテンションはCTRだけよりも優先される。.
  • 分かち合いだ: 多くの場合、認知された価値と肯定的な感情を示す。.

人口統計情報(推測されることが多い)

推測された人口統計学的情報は、幅広いオーディエンスの理解と分類に役立ちますが、パーソナライゼーションは、個人レベルでの直接的な人口統計学的ターゲティングではなく、主に行動とコンテキストのシグナルによって推進されます。.

ビデオ・コンテンツの特徴

YouTubeはまた、動画の内容や視聴者の反応を理解するために、動画自体の属性を評価する。.

  • メタデータ: タイトル、説明文、タグ、カテゴリは、分類と検索の関連性をサポートします。.
  • サムネイル クリック決定と初期CTRに大きな影響力を持つ。.
  • ビデオの時代: 新しい動画は、特定の文脈で鮮度やトレンドを高めることができる。.
  • 観客の維持: 視聴者がどれだけビデオを見たか。.
  • ビデオ品質: 解像度と音質は、間接的に満足度と視聴時間に影響する。.

コンテクスト要因

同じ人であっても、状況に応じて推薦する内容が変わることがある。.

  • 時間帯 習慣はさまざまだ(ニュース的な視聴と娯楽的な視聴)。.
  • 使用デバイス モバイルとデスクトップのパターンは異なる。.
  • 場所 言語の嗜好や現地での発見に影響を与える。.

継続的フィードバック・ループと適応学習

すべてのインタラクションはデータである

YouTubeがレコメンデーションを改善するのは、インタラクションから継続的に学習しているからだ。小さな行動もシグナルとして機能します。.

  • 視聴、再視聴、スキップ
  • 好き、嫌い、コメント
  • 検索、購読
  • 興味なし」の使用“
  • ビデオの早期放棄

リアルタイムのプロファイル更新とモデル学習

人々がコンテンツとインタラクションするにつれて、ユーザープロファイルと埋め込みは更新され、動画埋め込みは、システムが誰が動画を視聴し、その後に何が起こったかを学習するにつれて進化し、モデルは継続的なトレーニングサイクルによって改良される。.

アダプティブ・パーソナライゼーション

好みは固定されていない。旅行コンテンツを何カ月も見続けたかと思えば、子育てのヒントにシフトし、それから料理ビデオを見まくるかもしれない。システムは適応するように設計されているため、新たな視聴パターンが現れた後、おすすめがすぐに変わることがあるのだ。.

YouTubeレコメンデーションの主な構成要素

  • 候補者生成ネットワーク: 関連する可能性のある動画を幅広く検索し、高い再現性を実現します。.
  • ランキング・ネットワーク 多くの場合、予想される時計時間やセッションの時計時間と連動している。.
  • モデルを埋め込む: ユーザー、ビデオ、クエリを表現することで、システムがキーワード以外の類似性を測定できるようにする。.
  • 特集ストア: 特徴(履歴、ビデオ属性、コンテキスト)の大規模なコレクションを管理し、モデルに提供する。.
  • A/Bテストのインフラ: 満足度とエンゲージメントにおける測定可能な改善を確認するため、変更を大規模にテストする。.

A/Bテストが特に重要なのは、小さなモデルの変更が、何十億ものユーザーに大きなエコシステム効果をもたらす可能性があるからだ。.

YouTubeのAIアルゴリズム解説の実例がわかる広角編集写真:レコメンデーションの仕組み

推薦文が表示される場所(推薦文タイプ)

YouTubeは製品全体に同じ基本原則を適用しているが、それぞれの表面には異なる目的がある。.

おすすめホームページ

  • 目的 視聴セッションを開始または再開する。.
  • しばしば影響を受ける: 視聴履歴、購読、推測される興味。.
  • 典型的なミックス: おなじみのクリエイター、関連するトピック、探索的な内容。.

次のページとサイドバーのおすすめ

  • 目的 現在のセッションを延長する。.
  • しばしば影響を受ける: 現在のビデオとの類似性、他の視聴者が次に見たもの、個人の視聴パターン。.
  • 最適化の焦点: 継続性と勢い。.

検索結果

  • 目的 明示的な問い合わせに答える。.
  • 影響を受けている: キーワードの関連性、メタデータ、そのクエリのパフォーマンス(視聴時間、エンゲージメント)。.
  • 個人的に 履歴や過去の交流を見て、ユーザー間で結果を並べ替えることができる。.

トレンドタブ

  • 目的 人気動画や新着動画をプラットフォーム全体に表示する。.
  • パーソナライゼーション・レベル: 一般的に、個人向けではなく、勢いと幅広いアピールが原動力となる。.

購読フィード

  • 目的 ユーザーが明示的にフォローしているチャンネルのコンテンツを表示する。.
  • よくある行動: 多くの場合、時系列で、時にはトップビデオを強調するランキングもある。.

YouTubeショートフィード

  • システム: 短編の縦型視聴のために調整された明確なレコメンデーション・エンジン。.
  • 強調する: 急速な消費、目新しさ、より速いフィードバックループ。.
  • 忖度効果: 多くのアイテムを短時間で消費できるため、迅速な発見をサポートできる。.

ライブ・ストリームのおすすめ

  • システム: ライブコンテンツに特化したロジック。.
  • しばしば影響を受ける: リアルタイムの視聴率、トピックの関連性、クリエイターのライブ視聴者との履歴。.

最新のディープラーニングにおけるフィルタリングの概念

YouTubeがディープラーニングを使っているとはいえ、古典的なレコメンデーションの考え方は依然として適用される。実際には、完全に独立したモジュールとして実装されるのではなく、ニューラル・モデルや機能に統合される。.

コンテンツ・ベースのフィルタリング

  • トピック、ジャンル、クリエイターのスタイル、キーワード、ビジュアルのパターンなどが、視聴者がすでに楽しんでいるものと類似している動画をレコメンド。.
  • 多くの場合、似たようなコンテンツをクラスタリングするビデオ埋め込みによってサポートされている。.

協調フィルタリング

  • 似たようなユーザーが視聴し、エンゲージした動画をレコメンド。.
  • 多くの場合、同じような嗜好を持つ人々をクラスタリングするユーザー埋め込みによってサポートされている。.

ハイブリッド・アプローチ

YouTubeの現在のアプローチは、両方のスタイルを融合させている。コンテンツベースのシグナルは、類似性が明確な場合に役立ち、協調的なシグナルは、明らかに関連性はないが、類似した視聴者の間で優れたパフォーマンスを発揮するコンテンツを発見するのに役立つ。.

実例

例1:クッキング・ビンジ効果

短期間に何度も料理チュートリアルを見た後、ホームのレコメンデーションは新しいレシピ、料理チャンネル、キッチン機器のレビューにシフトすることが多い。システムは、持続的な視聴履歴を強い嗜好信号として読み取り、そのトピック・クラスタでより多くの候補を検索する。.

例2:Up Nextでのトピックの継続

量子物理学のビデオを見終わると、サイドバーが異なるクリエイターの関連講義やドキュメンタリーを推薦することがある。これは、キーワードやチャンネルが異なっていても、エンベッディングや「視聴者が次に見たもの」のパターンがコンセプトの類似性を示唆するために起こりうる。.

例3:検索パフォーマンスの効果

誰かが “DIY home repair ”と検索すると、視聴者がこれまで一度もホームリペアコンテンツを見たことがなくても、そのクエリで視聴時間やエンゲージメントが高い動画が検索結果に表示されます。検索意図は、フィールドを絞り込み、パフォーマンスとパーソナライゼーションは、最終的なランキングを並べ替えることができます。.

例4:小規模クリエーターのブレイクアウト

小規模なチャンネルでも、初期の視聴時間やエンゲージメントが高まれば、チャンネルが急増する可能性があります。そのパフォーマンスにより、Homeでより多くのインプレッションを獲得し、関連するオーディエンスのUp Nextに掲載され、購読者以外にもリーチを拡大することができます。.

例5:クリックベイトからのインセンティブ・シフト

誤解を招くようなタイトルやサムネイルでもクリックを生むことはできるが、視聴者がすぐにバウンスしてしまえば、配信が継続する可能性は低くなる。期待視聴時間やセッション視聴時間を中心に最適化されたシステムは、早期離脱として現れる不満を罰する傾向がある。.

例6:プラットフォームの成長ダイナミクス

レコメンデーションは、長い視聴セッションを可能にし、既存のクリエイターと新しいクリエイターの両方を発見する。業界の解説では、レコメンデーションが視聴時間の大半を占めていると主張することが多く、広く引用されている推定では70%を超えることもある。これらの数字は、プラットフォームの統計として確定されたものではなく、推定値として扱われるのがベストだが、方向性は明確である。.

利点と限界

メリット

  • 特に毎分何百時間もアップロードされる大規模なディスカバリーの高速化。.
  • 短期的な意図(検索)と長期的な興味(視聴履歴)のより良いマッチング。.
  • 動画が視聴者を満足させ、注目を維持することで、クリエイターは購読者以外にもチャンスを得ることができる。.
  • フィードバックループと管理された実験による継続的改善。.

制限事項

  • 探索や異常な視聴行動により、関連性のない推奨が表示されることもある。.
  • フィルターバブルのリスク。パーソナライズ化によって、多様な視点に触れる機会が狭まる可能性がある。.
  • インセンティブは、不健全なケースでのセンセーショナリズムを助長する可能性がある。.
  • ポリシーとモデレーション・システムは分配に影響し、執行を外部から解釈するのは難しい。.
YouTubeのAIアルゴリズムを説明するミニマリストのベクトルスタイルの図:レコメンデーションの仕組み

YouTubeのAIアルゴリズムと他のアルゴリズムとの比較

アスペクト YouTubeのおすすめ Netflixのおすすめ TikTok For Youページ
主な目的 予測される満足度を最大化する。多くの場合、多くのサーフェスでのウォッチタイムやセッションのウォッチタイムで測られる。. 専門的に制作されたタイトルの少ないカタログの中で視聴を促進し、多くの場合、継続視聴に最適化されている。. 素早くフィードバックされ、新規性の高い高速スクロールフィードで、迅速なエンゲージメントを最大化する。.
コンテンツ環境 アップロード速度が速く、非常に大規模で多様なユーザー作成ライブラリ。. キュレーションされたカタログは、アイテム数がはるかに少なく、タイトルごとのシグナルが豊富。. 短時間で消費されるようにデザインされた、トレンド主導の短編コンテンツ。.
フィードバック・ループ速度 高速だが、より長いセッション、複数のサーフェス、さまざまな長さのビデオにまたがっている。. タイトル数が少なく、消費パターンも長めである。. 非常に速く、数分のうちに多くのマイクロインタラクション(スキップ、再視聴、一時停止)ができる。.
最適 膨大なカタログの中から関連するビデオを見つけやすくし、トピックをまたいでセッションを延長できるようにする。. 管理されたライブラリーで、視聴者を次のショーや映画に誘導する。. 短編フォーマットの高速ディスカバリーとバイラル配信。.

YouTubeレコメンデーションと従来の検索エンジン

YouTubeはレコメンデーションファーストであり、従来のウェブ検索はクエリファーストである。どちらも高度な機械学習を使用することができるが、YouTubeは暗黙的なフィードバック(視聴時間、リテンション、エンゲージメント)と明示的なアクション(購読、検索)に大きく依存しているのに対し、ウェブ検索は主に明示的なクエリの意図と関連性のシグナルによって駆動される。YouTubeは通常、プラットフォーム上での視聴を長く維持するように最適化されているのに対し、ウェブ検索は多くの場合、素早く回答することを目的とし、ユーザーを他のサイトへ誘導する可能性がある。.

よくある質問

YouTubeのアルゴリズムはクリエイターにどのような影響を与えるのか?

レコメンデーションの配置は大量のインプレッションを促進できるため、視認性とリーチに強く影響します。セッションの視聴時間は主要な最適化ターゲットであるため、動画がクリック後も視聴者の注意を引きつけ、満足させることができれば、クリエイターは利益を得ることができます。また、視聴者が何に反応するかをシステムが学習するために、より新しいデータを作成するため、一貫性も役立ちます。.

YouTubeのアルゴリズムを騙せるか?

システムは洗練され、継続的に進化しているため、持続的な成長は操作からは生まれにくい。ボットや購入されたインタラクションのような人工的なエンゲージメント戦術は、しばしば検出され、ペナルティにつながる可能性がある。強力なパフォーマンスは通常、視聴時間、リピート視聴、ポジティブなエンゲージメントといった本物の満足シグナルからもたらされる。.

無関係な推薦文が表示されることがあるのはなぜですか?

よくある原因としては、視聴履歴が混在しているために嗜好のモデル化が難しくなっていたり、一時的に候補の生成に影響を与えるような異常値の動画があったり、システムが停滞を避けるために新しいトピックをテストするような意図的な探索があったりする。興味がない」というような明示的なフィードバックは、時間の経過とともに類似の推薦を減らすのに役立つ。また、大規模なパーソナライゼーションシステムでは、多少のミスマッチは避けられない。.

アルゴリズムはフィルターの泡を作るのか?

パーソナライゼーションは、視聴者が見る傾向があるものを優先するため、ある程度はそうだ。YouTubeは多様性に関する目標を掲げており、単調さを減らすために探索を導入することができるが、フィルターバブルはパーソナライズされたフィードにおける既知のリスクである。トレードオフとして、多様性が増すと短期的な関連性が低下することがある。.

YouTube Shortsのアルゴリズムは違うのですか?

Shortsは、短編の縦型ビデオと迅速な消費向けに調整された独自のレコメンデーション・エンジンを使用しています。より速いフィードバックサイクルは、配信を素早く変化させることができ、多くの長編パターンに比べて発見を加速させることができます。.

YouTubeのアルゴリズムはどのくらいの頻度で変更されるのですか?

YouTubeは1つの静的なアルゴリズムではなく、絶えず更新されるモデルとシステムの集合体である。大規模な再設計はまれですが、小さな変更、パラメータチューニング、機能の更新、A/Bテストは絶えず、時には毎日行われます。このような漸進的な変更が、時間の経過とともに、優れたパフォーマンスを大きく変えていくのです。.

YouTubeレコメンデーションについて覚えておくべきこと

YouTubeのAIアルゴリズムは、2段階のディープラーニングシステムとして最もよく理解されている。ほぼすべてのインタラクションから学習し、嗜好の変化に応じて適応し、「ホーム」から「次へ」、「検索」、「ショート」、「ライブ」まで、おすすめが表示される場所によってわずかに異なるロジックを適用する。.

クリエイターやマーケティング担当者にとって、この実用的な意味は単純明快だ: パッケージはクリックを生むが、満足は流通を支える. .タイトルとサムネイルは注目を集めることができるが、視聴者のリテンションとセッションの視聴時間は、通常、有望なアップロードをレコメンデーション・エンジンに変えるものである。実践的な運用マインドは、リテンションのために最初の30秒を改善すること、タイトルとサムネイルを動画が本当に提供するものと一致させること、そして、関連する別の動画を見ることが自然な次のステップであると感じられるように動画を構成することです。.