AI LabとGovTech開発センターが推進する、社会実装されるエッジAIの現状とその未来

当社には、特定の分野に抜きん出た知識とスキルを持ち、第一人者として実績を上げているエンジニアを選出する「DeveloperExperts 制度」があります。ML モデルチューニング・エッジ AI 分野の Developer Experts に新たに選出されているのが兵頭です。
SIer のマネージャーからサイバーエージェントに転職し、エッジ AI の Experts になるまでの過程、産学連携や行政 DX における実績、本人が描くキャリア観を聞いてみました。

兵頭 亮哉

2021 年中途で入社し AI Lab HCI チームに所属。大阪大学大学院基礎工学研究科 招聘研究員。対象領域は、HCI / HRI /インタラクション/対話システム/機械学習/画像処理/自然言語処理。モデル最適化や EdgeAI に特に強み。日常的に OSS へコミットし続けている。主力 OSS『PINTO_model_zoo』『openvino2tensorflow』『tflite2tensorflow』『simple-onnx-processing-tools』。
OpenCV AI Kit (OAK) のコアコントリビュータ。Intel 特別招待講演『エッジ推論のための各種フレームワーク間ディープラーニングモデル変換と量子化』『最新の OpenVINO™ ツールキット マニュアルビルドを使用したステレオ深度推定モデルの最適化』

SIerのマネージャーからサイバーエージェントに転職。エッジAIの Expertsに。

兵頭さんのキャリアを教えてください

兵頭:前職では 16 年間、システムインテグレーター (SIer) のシステム開発部門や研究開発組織 (R&D) に所属し、R&D チームのマネジメントに従事してきました。2021 年にサイバーエージェントに中途入社し、AI 事業本部の AI Lab でリサーチエンジニアをしています。私の専門は、ニューラルネットワーク (NN) モデル構造のフレームワーク最適化やフレームワーク間 NN モデルコンバージョンです。また、IoT/AI 分野で日本人唯一の Intel Software Innovator となっています。現在は、大阪大学の石黒研究室と産学連携でロボットの研究 [1] を進めています。

石黒研究室との産学連携では、どのようなプロジェクトに携わっているのですか?

兵頭:我々のチームは「社会課題に対するロボットの研究と開発、および現地での実証実験」に携わっています。具体的には、店舗やホテルで稼働するロボットと、お客様との間における対面インタラクションを通じて、顧客満足度の向上や店舗売上の向上に注力しています。

「ロボット開発」と聞くと、メカニカルな姿を想像するかもしれませんが、大阪大学 石黒研究室と共同開発しているロボットは、手足が短く、愛らしい顔もあって、お客様に好感を持って受け入れてもらっています。
お客様がロボットと接する事によって観測できる、人間の行動や心理学的側面に近い振る舞いの研究も行っていたりします。[2]我々のチームでは、数字や売上などの具体的な実績を重視していて、リサーチサイエンティストも論文を執筆する際に、その点を反映する事を意識しています。一連の成果はロボティクス分野のトップカンファレンス「IROS」で 2 本の論文採択 [3] をはじめ、数多くの学会に採択されています。

チームの中での兵頭さんの役割を教えてください

兵頭:我々のチームを一言であらわすなら、まるで総合格闘技チームと言いましょうか。特定の領域だけを専門にするというスタンスではなく、成果や目的のためには一人何役でもこなすのが当たり前の、少し変わったチームです。そんなチームの中でも、私は特に「何でもやるマン」です。専門であるエッジ AI の実装に限らず、ロボットのモーターサーボの組み立て、3D プリンタでの加工、エッジ AI のカメラ制御、機械学習、クラウドサービスの構築など、幅広くなんでもやっています。

まるで起業したばかりのスタートアップ企業のようなベンチャー感ですね。チーム構成も少人数なのでしょうか?

リサーチサイエンティスト 6 名とリサーチエンジニア 3 名でチームが構成されています。課題やビジネス要件に応じて、ロボットの制御プログラムや論文の執筆など、多岐にわたるタスクを分担しています。特に、リサーチサイエンティストは論文執筆とプログラミングの両方をこなせるのがベストですが、パフォーマンスを優先して、専任のリサーチエンジニアをアサインして実装にあたっています。

海外では、リサーチサイエンティストが論文や仮説を立て、リサーチエンジニアがそれを実装するといったコラボレーションが主流なようです。役割分担が明確なので、成果が出やすくなるのが特徴です。

行政 DX に社会実装されるセンサス AI のリアル

並行して携わっている行政 DX(GX) についても聞かせてください。

兵頭:2022 年 4 月に AI 事業本部の「GovTech 開発センター」[4] がリリースした新規事業「センサス AI」[5] の立ち上げの際、プロダクトマネージャーの三宿から声がかかり、私が「センサス AI」[5] のアドバイザーとしてチームに加わりました。当時はエンジニアの第一号としてジョインしたので、まさにスタートアップ企業のような環境でした。私が担当したのは、自治体向けのエッジ AI を活用した実証実験と分析、および最終報告書の作成です。

自治体の課題は様々あるかと思います。具体的には、どんな課題が議題にあがるのですか?

兵頭:各自治体はそれぞれ独自の課題をもっていますが、例えばある自治体の担当者から「市内に 1 ヶ月間設置した定点カメラの映像から、DX のアイデアを生み出してほしい」というリクエストをいただきました。エッジ AI を活用した予算的に可能な提案を何個か挙げ「どの案に取り組みますか?」と聞いてみたところ、「全てやりましょう!」と回答してくれました。自治体の本気度や、その方のチャレンジ精神を象徴するもので、開発者マインドが高まりました。
その自治体の商店街は、街並みが美しく昔ながらの風景が広がっています。その商店街に対して、行き交う人々の通行量をカウントするだけでは物足りなかったので、AIを活用した新しい切り口を提案しました。例えば、どの種類の店舗が地図上に存在し、どのルートがより歩きやすいか、ある時間帯では特定のルートに人が流れやすいかなど、その特徴を含めた調査です。

エッジ AI と分析を組み合わせた提案は、単なる交通量計測を超えて、都市環境の整備や改善に新たなアイデアを提供できると考えています。

自治体と一緒になって、課題と効果を考えるのはおもしろそうですね

兵頭:我々に声をかけてくださる自治体の担当者は、常に新しいことにチャレンジする姿勢があるため、サイバーエージェントのカルチャーとも相性が良く、テンポ良く案件が進んでいきます。十分な検証と仮説、しっかりとした報告を行うことで信頼していただけるので、とてもやりがいがあります。「テクノロジーでこういう社会実装をしたい!」と思うことを、気兼ねなく提案できるため、意見を出しやすい環境でもあります。
交通量計測だけでなく、公共空間にデジタルサイネージを設置して、渋滞を解消するなどのアイデアも議題にあがったりします。

自治体も「こういう街づくりをしたい!」というビジョンや構想があり、プロジェクト規模も大きいため、「GovTech 開発センター」や「センサス AI」の広がりも期待できそうです。

都市計画まで構想が広がっているのは魅力的ですね

兵頭:エッジ AI を活用した地道で泥臭い実証実験の積み重ねが、自治体の構想によって都市計画にまで広がっていくので、働いていてもスケール感を感じられます。例えば、国土交通省は、道路交通量の調査方法をこの年度から人手による計測から完全にシフトさせ、路上のカメラ映像を AI で解析 / 活用する手法に変えています。

「人による調査からカメラ映像に切り替えた先で何をやるか?」は自治体によってまだ手探りの状態です。このように、正解がない中で、ビジョンやアイデアをもって挑戦的に取り組む自治体の姿勢は、ある意味サイバーエージェントと通じるところがあります。我々も「GovTech 開発センター」や「センサス AI」を通じて自治体の GX に貢献することで、サイバーエージェントのパーパス [7] である「新しい力とインターネットで日本の閉塞感を打破する」「あらゆる産業のデジタルシフトに貢献する」に沿った仕事を実感できています。

エッジ AI を行政に活用する際に、どんな点に技術的な課題や難しさがあるのでしょうか?

兵頭:例えば、小型ビジョンカメラの導入と映像から得られるデータを活用した分析。一見スマートなソリューションに見えますが、実際には非常に複雑な課題に直面します。「全体予算に対して、どの程度のコストで機材を調達するか?」「東北の雪深い地域の設置に際して、積雪や冷気に耐えうる機材の選定」「交通量が多い環境で、直射日光の下に長期間設置しても損傷を受けないボックスの選択」などが課題となります。

東京の中心部にある実験場に出向いたりもしますし、交通量の撮影許可を取得するために申請書を書いて警察署に出向いたりもします。このような地道な検証や事前準備は非常に煩雑ですが、エッジ AI の社会実装には必要不可欠です。

非エンジニアから 5 年でエッジ AI の Experts になれた理由とは?

研究やエンジニアリングに留まらず、ハードや行政手続きなど、守備範囲とフットワークが素晴らしいですね。

兵頭:自分はビジョンややりたいことがはっきりしているので、肩書きや役割はあまり重視しないタイプです。先程も話した通り、私は「なんでもやるマン」という性格です。2004 年に新卒で SIer に入社し、13 年間にわたって様々な仕事に取り組んできました。
当時は今ほどエンジニアの職種がはっきりとしておらず、開発に関するあらゆることを手がけるのが当たり前でした。例えば、物理サーバーのメモリ増設のために秋葉原まで買いに行き、その足でデータセンターに挿しに行ったりすることもありました。
障害があったらデータセンターまで障害対応に行くこともありましたし、予算の調達から請求までやっていました。私の「なんでもやるマン」はそこが原点かもしれません ( 笑 )。

SIer からエッジ AI に転身するのは稀有なキャリアです。何かきっかけがあったのでしょうか?

兵頭:転職 2 社目で心に余裕が生まれ、趣味でハードウェアや機械学習に興味を持ち、開発メモ的にブログを書き始めました。
2018 年からは、1 週間に何十本ものブログ記事を書くようになりました。スキルが不足していることを自覚しているため、書いたことを忘れないように自分に備忘録とメッセージを残していました。最初はロボットが趣味でしたが、ロボットをやるうちに機械学習にも興味を持ち、今では機械学習に専念しています。当時の日常の仕事はマネジメントでしたが、家に帰ってからは、趣味のエンジニアリングに没頭する日々を送っていました。

・趣味の開発アカウント情報 [8]
・個人の技術ブログ – Qiita [9]
・個人の技術ブログ – Zenn [10]
そんな事を何年か続けているうちに、私のブログやツイートがサイバーエージェントの AI Lab メンバーの目にとまり、「この人、めちゃくちゃ面白い」と話題になっていたそうです。その後、AI Lab で石黒研究室との産学連携を立ち上げた馬場から「兵頭さん、ロボットの研究開発をやってみませんか?」とコンタクトがきたのが、サイバーエージェントとの出会いのきっかけです。馬場とのカジュアル面談は魅力的で、その場で前職のマネージャー業務を辞めて、サイバーエージェントに転職することにしました。

とても勇気がもらえるエピソードですね。マネジメントの業務をする傍ら、技術やエンジニアリングの趣味に没頭し、積極的にアウトプットすることで、AI Lab のような先進的な研究をしているチームの目に止まり、採用オファーがくる。そして入社後にサイバーエージェントのDeveloper Experts に選ばれる。スキルアップとアウトプットを継続する事の可能性を感じられます。

兵頭:アウトプットを続けることで、自分の目には映らないような知らなかった知見を得ることができます。既にはるかにレベルの高い人がいることが分かっているので、自分が理解したことをアウトプットし続けると、アドバイスをもらえる仕組みができます。
「こうした方が良い」「もっと良い方法がある」といったアドバイスが、国内外から自然と入ってくる状態になりました。周囲からの知識の吸収速度が加速することで、自分一人では到達できないような高みまで成長できるようになったと思います。
先日開催された「CyberAgentDeveloperConference2023」でも「Q&A」のパートでトークしていますので、よかったらご視聴ください。[11]

先行きが不透明な時代だからこそ求められる「変化対応力」とは?

兵頭さんが社会人になった 2000 年代くらいの環境と、現在の 2023 年の環境を比較すると、AI などの技術革新によって環境が大きく変化しているのが特徴です。今、エンジニアを目指す学生にとって、何を重視して学ぶべきでしょうか。

兵頭:先行きが不透明な時代と言われていますが、国内外で景気が良く、特に IT への投資が続いているため、特定領域のスペシャリストとして仕事を続けられる環境があります。ただし、これは景気が良い時に限る話であり、景気が悪化すると、特定の技術だけでは生き残ることができなくなる時代になるかもしれません。
私は 2000 年頃の IT バブルや 2007 年のリーマンショックという 2 度の大型不況を経験してきました。技術を持っていても、開発案件が皆無になり、エンジニアの仕事がなくなる時代でした。リーマンショックのような世界恐慌が、再び訪れないと断言することはできません。そのため、技術的な知識を幅広く持つことが重要だと思います。「何でもやるマン」はある意味、私なりの人生のリスクヘッジなのかもしれません。

「何でもやるマン」は、時に「便利屋さん」「中途半端なスキルセット」に思われがちで、不安定な印象もありませんか?

兵頭:景気が急激に悪化するような時には、柔軟性や変化対応力が、底力のように自分を支えてくれる場合があります。リーマンショックでは、常駐していたエンジニアが全員引き上げになりました。仕事がなくなると、特定のスキルを持っていても、そのスキルを活かす場所がなくなってしまいます。
「今の仕事のスキルセット」や「自分が所属する会社やチームの事業ドメイン」に固執せず、興味のある分野にあれこれ手を出し、多角的なスキルや知見を身につけることが大切です。私は、前職・現職含めた案件で、電車, トラック, フォークリフト, 自動車など、交通に関することなら何でも対応してきました。きっと新しい事業ドメインでも何とかなると思っています。
偶然、前職の仕事とは全く無関係の「エッジ AI」分野で声がかかりましたが、アンテナを広げて、アウトプットし続けていれば、いつか自分の技術を求めている人の目に留まるのだと、あらためて思いました。

職種や役割にとらわれずに、変化対応力やフットワークを身につけるにはどうしたら良いでしょうか。

兵頭:仕事をしていると、自分の担当範囲外で声をかけられることが多かれ少なかれあると思います。そのような場合「声がかかったら断らない」という姿勢が大切です。例えば、サイバーエージェントでは、ふとしたことから会社の組織課題について Slackで声をかけられたり、技術的な質問をされることがよくあります。話を聞いてみると、様々なニーズがあり、自分のもっているスキルセットがうまくマッチングする事があったりもします。
自分の仕事とは無関係だったとしても、声がかかったら断らずに積極的に関わることで、知らなかった技術や事業ドメインにふれるきっかけになります。それがサイバーエージェントの強みの 1 つ「変化対応力」[12] の源泉なのかもしれませんね。

参考資料

  1. https://research.cyberagent.ai/academic-relations/ishiguro/
  2. 接客対話エージェント – ヒトが信頼するインタラクション研究
    https://www.youtube.com/watch?v=Vr2cNGfOeSc
  3. https://www.cyberagent.co.jp/news/detail/id=27982
  4. 官公庁・自治体向けの DX 推進を強化、開発専門組織「GovTech 開発センター」を設立 行政のデジタル化・スマートシティの実現へ
    https://www.cyberagent.co.jp/news/detail/id=25389
  5. GovTech 開発センター、AI による交通量解析サービス「センサス AI」の提供を開始
    https://www.cyberagent.co.jp/news/detail/id=27542
  6. https://census-ai.jp/
  7. パーパス「新しい力とインターネットで日本の閉塞感を打破する」に込めた想い
    https://www.cyberagent.co.jp/way/list/detail/id=26689
  8. https://github.com/PINTO0309
  9. https://qiita.com/PINTO
  10. https://zenn.dev/pinto0309
  11. ビジョン・音声用機械学習モデルのモバイルデバイス向け最適化技術【CADC2023】
    https://www.youtube.com/watch?v=WSMKvzXaLE4
  12. 「変化対応力」を武器に「開発力倍増」に取り組む
    https://developers.cyberagent.co.jp/blog/archives/40515/