5月15日(金) 12:50 - 13:20 SRE Track
SRE 中級者

クラウドからエッジまで ― 1,700台を支える監視設計

我々のプロダクトではジムや介護施設などの現場にカメラとエッジデバイスを設置し、AIによる混雑分析や危険検知ソリューションを提供しています。 事業急拡大に伴うデバイス台数の増加に対し、従来のエッジ環境の監視・運用手法では限界が見えていました。 そこで、クラウド環境で活用を検討していたNew Relicをエッジデバイスへと展開しました。 ネットワーク不安定化によるデータ欠損や、デバイス停止といったエッジデバイス特有の課題に対し、監視の徹底による早期検知と自動リカバリの仕組みを段階的に構築しました。 現在は、1,700台を超えるエッジデバイスを安定運用しながら、開発チームが本来の責務である新機能開発に集中できる体制を実現しています。 本講演では、この半年間の試行錯誤の軌跡と、監視強化/運用自動化によってチームの働き方がどう進化したかをお話しします。

スピーカー

Koumei Ueda
Koumei Ueda
murasame CEO/CTO
専門学校在学中にスタートアップにてバックエンドのリアーキテクト業務を経験。2025年にDevOps/MLOpsエンジニアとしてSansan株式会社へ新卒入社。現在は社内のEKS基盤(Circuit)の運用やコスト削減、監視の最適化を行っている。 業務委託として、株式会社 Opt Fitにてクラウド / エッジでの監視基盤の設計を行っている
Kazuya Nishi
Kazuya Nishi
株式会社Opt Fit エンジニア
愛知県在住。 株式会社Opt Fit ソフトウェアエンジニア 元 Sansan株式会社 R&D DevOps / Platform チームリーダー Google Cloud Certified Professional Cloud Architect 機械学習エンジニアとしてキャリアをスタートし、MLOps・DevOps・SREを横断しながらプロダクト価値を最大化する基盤づくりに従事。Sansan株式会社 研究開発部では、社内初のEKS(Kubernetes)アプリケーション基盤の構築・標準化を主導し、Knative Servingの導入、SLO設計、Four Keys可視化、EKSアップグレード戦略改善などを推進。年間リリース数を10倍以上に増加させるなど、開発生産性と信頼性の両立を実現した。 PlatformチームおよびDevOpsチームのリーダーとして複数チームを率い、インフラ最適化(年間5万ドル超のコスト削減)、Observability強化、負荷試験基盤の標準化、Infrastructure as Codeの推進などを実行。技術導入だけでなく、組織設計や採用、グローバル対応まで含めた「スケールする開発組織づくり」に取り組んできた。 現在は株式会社Opt Fitにて、AIカメラ×クラウドのハイブリッドアーキテクチャを活用した大規模推論基盤の設計・リアーキテクチャ、ブルーグリーンデプロイ導入、IAM再設計、CI/CD刷新などを推進。シリーズBフェーズにおける少数精鋭組織で、信頼性・生産性・セキュリティを高めるエンジニアリングを担っている。 Kubernetes Meetup Tokyoをはじめとした外部登壇、技術ブログ執筆、OSSコントリビューションなど社外発信も積極的に行う。 専門領域は Kubernetes / EKS / AWS / GCP / MLOps / DevOps / SRE。