Ameba

, ,

Ameba は月間 PV 数 50 億、月間利用者数(延べ)7,500 万人、月間ブログ投稿数 550 万と国内最大級のメディアです。2022
年でサービス開始から 18 年周年を迎え、Ameba ブログをはじめ、最新の芸能人ニュース、アバター SNS アプリ、マンガ、占いなど多くのサービスを展開しています。サービスの記事テキスト、画像データ、行動ログなどを活用してビジネス職や ML エンジニアと一緒に問題の発見から解決まで一貫した支援を行います。

Member

Data Scientist : 課題発見、要件整理、統計・機械学習手法などを用いた分析、結果活用サポート、施策提案、意思決定支援など
ML Engineer : ユーザーの属性推定、記事テキスト解析、記事品質推定、MLOps 構築
Data Engineer :DMBOK を参考にデータ成熟度改善。具体的には、データガバナンス、データ品質、データ転送といったデータ基盤の改善・保守運用。

使用している主な技術

Python, R, Multivariate analysis, Statistical modeling, AB testing, GitHub Actions, Tableau, Terraform, ArgoCD, BigQuery, Cloud Functions, Dataplex, GCS, Vertex AI, DAMA-DMBOK

データ分析

解決したい課題/ ユースケース

Ameba ではビジネス職のデータスキル(SQL、BI、ロジカルシンキング)の育成に積極的に取り組んでおり、データスキルを身に着けたビジネス職が 10 名以上在籍します。そのため簡単な集計ベースの分析はビジネス職が行い、データサイエンティストがデータ抽出に追われることがなく、より専門性を発揮しやすい環境となっております。業務は事業が注力するいくつかの領域があり、そこをビジネスメンバー、エンジニアなどと連携してデータを活用した意思決定支援や機械学習システムの改善支援を行い業務イメージを紹介します。まずサービスの現状を把握して、ユーザーやコンテンツ(ブログ記事など)のどこに問題があるのかを明らかにします。ユーザーの問題を明らかにするには、ユーザーの行動プロセスやファネルを定義してどのセグメントに問題があるか深堀ります。またコンテンツの問題を明らかにするには、コンテンツのライフサイクルや需要と供給のバランスなどからどこに問題があるのか深堀ります。そしてユーザーやコンテンツに関わる何の問題を解決する施策なのか、できるかぎり具体化した上で施策を実施します。施策実施後は効果検証を行い、なるべく前後比較ではなくランダム化比較試験となるような設計を開発担当者と相談しバイアスに注意を払いながら効果検証ができるようにします。このような流れで問題発見と効果検証により質の高い施策を実施できるように取り組んでいます。

ML システムの開発

解決したい課題/ ユースケース

Ameba ではかなり早くからデータ活用に取り組んでおり、記事推薦システム、検索システム、自然言語処理システムといった多くの ML システムが存在します。これまでの ML システムは、データ基盤がレガシーな環境であったこともあり、システム間の繋ぎ込みが複雑で機能分割がそれほど行われていないアーキテクチャーでした。しかしデータ基盤を Google Cloud へ刷新するのに伴い、ML システムについてもモダンなものに刷新しています。例えば、これまではデータマネジメントの責務を担った人材がいなかったため、データの前処理や加工を各 ML システムで巻き取っていましたが、データマネジメントチームが立ち上がったことにより、責務を適切に分けた開発ができるようになりました。既存のシステムを新環境へ刷新していくのはもちろん、レガシーな環境に依存しない形での新規 ML システム開発も検討しています。
現在はこのように持続可能な ML システムを開発できることを目指しています。

関連リンク

サービス紹介