AI/Data Technology Map

極予測 TD

キーワード総数：約8億 4,300万件
自動生成導入対象クライアント：約300社
対象adgroupのRSA組み合わせ予測数：約5100万件 

極TD は検索連動型広告の広告文クリエイティブである TD(Title-Description) の品質性能をAI を用いて向上させるプロダクトです。AI により自動生成された広告文アセットに対し、更に効果予測AI を適用することで、広告媒体の検索エンジンに入力される実際の検索クエリ・キーワードに対し最大の広告効果を発揮する広告文アセットの組み合わせ効果予測が可能となっています。現状は入稿作業を強力に支援＆大幅に省力化するためのアプリケーションですが、将来的には入稿作業に人間の手を介在させない完全自動入稿体制を目指していきます。

Member

Data Scientist : 自然言語処理・機械学習を用いた効果予測モデルの構築、プロダクト実装
ML Engineer : 学習基盤やバッチプログラムの設計・開発およびDataOps・MLOps
Product Manager : プロダクト要件、PL 責任
Project Manager : 利害関係の調整、まとめ、みんなの相談役
Web Engineer : 画面系サービスのDevOps

使用している主な技術

DeBERTa V2, GPT-4o, Learning-to-Rank, Doc2Vec, Word Mover’s Distance, Python, PyTorch, ONNX, Sudachi, Optuna, LightGBM, FastAPI, RQ(Redis Queue), Playwright, BigQuery, Cloud Dataflow, Cloud Composer, VertexAI (Pipelines, Experiments), Cloud SQL, ECS Fargate, ElastiCache

生成AI

極予測TD の予測モデルとそのユースケース

解決したい課題/ ユースケース

2024 年時点の検索連動型広告の入稿方式は、各主要広告媒体(Google, Yahoo, Micosoft) ともレスポンシブ検索広告という方式に移行しています。
具体的には、1 レスポンシブ検索広告あたり、広告見出し文・説明文のアセットを複数本入稿することで、広告媒体側で検索クエリ・KW に応じて最適な広告アセットを選択表示する方式になります。極予測TD はこのレスポンシブ検索広告の入稿候補を制作支援するアプリケーションです。広告制作ライターは、極予測TD を用いて、AI により大量生成された自動生成アセットを元に、効果予測AI を利用しながら校正・組み合わせすることで最適な入稿候補を制作します。極予測TD のアプリケーションには下記2 つの予測モデルが実装されており、広告制作フローとして各予測モデルの出力が両立して高スコアとなる広告アセットの組み合わせを制作・入稿するために利用されています。

「広告の有効性」予測モデル
各広告媒体が互換性のある形で提供している評価指標、「広告の有効性」を目的変数とした予測モデルになります。「低い」「平均的」「高い」「非常に高い」の4 値で評価されるラベルであり、多値分類モデルにより実装されています。
「組み合わせ効果」予測モデル
広告配信におけるKPI(CTR,CPA等)を目的変数とした予測モデルになります。既存No􏚲の広告効果を上回った組み合わせを入稿するという制作フローの要件を満たすため、ランキング学習モデル(LambdaMART) により配信中広告・入稿候補広告の広告効果の優劣予測を比較する実装となっています。

1，2 の各モデルともに、特徴量は広告アセットや検索キーワードなどを特徴量エンジニアリングして用いています。

極予測TD に要求される性能要件とそれを支えるアーキテクチャ

解決したい課題/ ユースケース

広告制作ライターの入稿作業において円滑な作業体験を提供するために、ユースケースおよびそれに応じたシステムとしての処理特性を鑑みた下記の2 層のアプローチをとっています。

現在配信中広告に対する最新の入稿候補の予測結果は、日次実行の夜間バッチでスループット重視のバッチ予測を予め行う形で準備しておく
極予測TD のアプリケーション画面上で広告アセットに修正が行われたときに求められるオンライン予測に対しては、レイテンシ重視の予測API を提供することで対応する

1.と2. は効果予測モデルにおいては同様のものを用いていますが、1. のバッチ実行は、2. よりも結果を返すまでの時間的な猶予が2. より長いことを利用し、AI 自動生成アセットに対する前処理フィルタとして広告アセットを事前校正するための複数の言語モデルやロジックが追加実装されています。また、バッチ実行対象の広告数も数十万件に上るため、夜間という一定の時間内で全処理を終了させるために、テーブルデータのバルク変換処理にはELT(Extract-Load-Transform) 実行基盤としてBiqQuery SQL による一括処理で実行、バッチ予測に伴うCPU,GPU バウンドな処理はETL(Extract-Transform-Load) 実行基盤としてCloud Dataflow を採用し数千インスタンス規模のマシンリソースのスケールアウトを任せて実行、といった形でそれぞれのタスクの処理特性に応じた最適なクラウドコンポーネントを用いることで対応しています。