SRE/SRE部
- 年収
-
800万円〜1,500万円
- 勤務地
-
東京都
- 職務内容
-
募集背景
サービス規模の拡大に伴い、DMMのSRE部が向き合う運用課題は年々複雑化しています。
障害対応、オンコール、コスト管理、設定変更の影響把握など、「判断が遅れること自体がリスクになる」場面も増えてきました。これまで私たちは、標準化・自動化・可観測性の整備によって運用を改善してきましたが、次のステップとして、運用データや過去の知見をAIに活用させるフェーズに進んでいます。
SREの経験を持つエンジニアがAIを理解し、AIを理解したエンジニアがSREの現場を知ることでしか実現できない取り組みです。
運用の最前線で課題と向き合いながら、SREのあり方そのものをアップデートしていく仲間を募集しています。
事業概要
DMMは、動画配信、電子書籍、EC、ゲーム、金融など、多様な事業を展開する多角化企業です。
それぞれの事業は独立したスピード感で成長する一方、その基盤となるインフラと運用の信頼性が、全社の価値提供を支えています。SRE部は、こうしたDMMの複数事業を横断して支える専門組織として、サービスの可用性・信頼性・パフォーマンス・コスト最適化を担っています。
個別の基盤は各サービスの担当が担いますが、共通でメリットが出る部分は特定のプロダクトに閉じず、共通基盤・共通指針を整備することで、事業やチームの増減に左右されない安定した運用を実現しています。また、可観測性基盤を中心としたデータに基づく運用や、自動化・標準化による運用負荷の低減にも継続的に取り組んできました。
現在はさらに一歩進み、これらの運用データや知見をAIと組み合わせることで、障害対応や意思決定をより再現性の高い形へ進化させる挑戦を進めています。SRE部のミッションは、単に「障害を防ぐ」ことではなく、事業が安心して挑戦できる土台を提供し続けることです。
技術と運用の両面からDMMの事業成長を支えることが、私たちの役割です。「業務内容」
SRE部の一員として、DMMが展開する複数の事業・サービスを横断的に支える
信頼性・可用性・運用効率の向上に取り組んでいただきます。主な業務内容
AI Agentの開発を通した運用改善
運用データを活用した障害対応・判断支援の自動化
LLMを用いた運用ナレッジの整理・検索・活用の仕組みづくりサービス信頼性の向上
可用性・パフォーマンス・耐障害性を考慮したシステム設計・改善
障害発生時の原因分析および恒久対応の実施可観測性の設計・運用
メトリクス/ログ/トレースを含む可観測性全体の設計・改善
特定ツールに依存しない、可観測性の考え方・設計方針の整理
サービス特性に応じた監視・アラート設計および運用改善
運用データを活用した課題発見・障害予兆の検知
クラウド、オンプレ双方のオブザーバビリティツール基盤(Datadog/NewRelic/Prometheus)の構築・運用運用の標準化・自動化
手作業に依存しない運用フローの設計・実装
Runbookや運用手順の整備・改善コスト最適化の推進
クラウドリソースの利用状況の可視化
コスト削減施策の立案・実装・全社展開事業部・開発チームとの協業
各事業のSRE/開発チームと連携した課題整理・改善提案
共通基盤・共通指針の整備による組織全体の信頼性向上「ポジションの魅力」
このポジションの特徴
特定のプロダクトに閉じず、横断的な視点でSREに取り組める
可観測性・自動化・コスト最適化といったSREの王道領域をしっかり経験できる
AI活用は「必須スキル」ではなく、現場課題から自然に使うフェーズ
仕組みを作って終わりではなく、全社に広げ、定着させるところまで関われる - 企業名
-
合同会社DMM.com
- 本社所在地
-
東京都港区六本木3-2-1住友不動産六本木グランドタワー24F
- 雇用形態
-
正社員
- 各種保険
-
健康保険 雇用保険 厚生年金 労災保険
- 休日休暇
- 情報更新日
-
2026/06/16
AIが推定した求人関連情報
-
横断的なSRE経験が積める:
特定のプロダクトに閉じず、動画配信・電子書籍・EC・ゲーム・金融など、DMMが展開する多様な事業を横断的に支えるSRE業務に携わることができます。幅広いサービス規模・特性に触れられる希少な環境です。 -
AI×SREの最前線に立てる:
LLMやAI Agentを活用した運用改善・障害対応支援の自動化など、SREとAIを組み合わせた次世代の取り組みを現場課題から自然な形で推進できます。「AI活用が必須スキル」ではなく、現場から生まれる実践的なアプローチです。 -
可観測性・自動化・コスト最適化のSRE王道領域を網羅:
Datadog / NewRelic / Prometheusなどのオブザーバビリティツールを活用した可観測性基盤の設計・運用、Runbook整備、クラウドコスト最適化まで、SREの本質的な領域を幅広く経験できます。 -
仕組みを全社へ広げるインパクト:
共通基盤・共通指針の整備を通じ、個別チームに閉じない形で組織全体の信頼性向上に貢献できます。仕組みを作るだけでなく、全社に定着させるところまで関われるポジションです。 -
大規模サービスを支えるインフラ経験:
DMMは会員数約3,000万人、月間PV数約25億を誇る大規模サービス群を運営しています。高トラフィック・高可用性が求められる環境でのSRE経験は、エンジニアとしての市場価値を大きく高めます。
以下のいずれかの経験・知見が求められます。
- SRE・インフラ・サーバーサイドエンジニアとしての実務経験
- クラウドインフラ(AWS / GCP / Azure 等)の構築・運用経験
- 可観測性ツール(Datadog / NewRelic / Prometheus 等)の活用経験
- 障害対応・原因分析・恒久対応の実施経験
- CI/CDを活用した開発・運用フローの経験
- Runbook・運用手順の設計・整備経験
-
課題を構造化して解決に導く思考力:
障害対応やコスト最適化など、複雑な運用課題に対して原因を整理し、再現性ある解決策を設計・実装できる論理的思考力が求められます。 -
事業部・開発チームとの協業力:
複数事業・チームと連携し、課題の整理から改善提案・共通指針の整備まで、技術と組織の橋渡し役を担えるコミュニケーション能力が必要です。 -
自律的なオーナーシップ:
「仕組みを作って終わり」ではなく、全社への定着まで責任を持って推進できる、高い当事者意識と自走力が求められます。 -
継続的な学習意欲:
SREとAIという急速に進化する領域を横断するポジションであるため、新技術・新手法を積極的にキャッチアップし、現場に取り入れていく姿勢が重要です。 -
不確実性への適応力:
多角化事業を横断する組織特性上、チームや事業の変化も生じやすい環境です。変化に柔軟に対応しながら、安定した運用基盤を維持・向上させる適応力が求められます。
-
LLM / AI Agent の活用経験:
運用データへのLLM適用、AI Agentを用いた自動化・判断支援の設計・実装経験があると即戦力として活躍できます。 -
Kubernetes / コンテナ基盤の運用経験:
Kubernetesを中心としたアプリケーションプラットフォームの構築・運用経験は、DMMのインフラ基盤の改善に直接貢献できます。 -
Go言語などのバックエンド開発スキル:
運用自動化ツールや内製エコシステムの開発において、Go言語等での実装経験があると活かせます。 -
SLI / SLO の設計・運用経験:
サービス信頼性指標の定義・計測・改善サイクルの経験は、DMMの信頼性向上の取り組みに直結します。 -
オンプレ・クラウド双方の運用経験:
DMMはクラウドとオンプレ双方のオブザーバビリティ基盤を持つため、ハイブリッド環境での運用経験が歓迎されます。
-
AI×SREの実践的ノウハウ:
LLMや運用データを活用した障害対応支援・判断自動化の設計・開発を通じ、業界最前線のAI活用スキルを実務レベルで習得できます。 -
大規模マルチサービス環境での可観測性設計力:
多様な事業・サービスを横断した可観測性基盤の設計・改善を通じ、特定ツールに依存しない普遍的な設計思想とスキルが身につきます。 -
全社横断の標準化・推進スキル:
共通基盤・共通指針の整備と全社展開を担うことで、技術だけでなく組織横断での推進力・ステークホルダーマネジメント能力が養われます。 -
クラウドコスト最適化の実践力:
クラウドリソースの可視化から削減施策の立案・実装・展開まで、FinOps的な観点でのコスト最適化スキルを習得できます。 -
SREエンジニアとしての総合的な実践力:
障害対応・オンコール・Runbook整備・自動化・監視設計など、SREの王道領域を大規模サービスの現場で実践的に磨くことができます。
- 現在(SREエンジニア)
- シニアSREエンジニア AI活用・可観測性・自動化など複数領域での実績を積み、技術的リードとして複雑な課題解決や設計判断を主導できる存在へ成長します。
- テクニカルリード / スタッフエンジニア DMM全社横断の技術課題を担う技術スペシャリストとして、共通基盤のアーキテクチャ設計や技術指針の策定をリードするポジションです。
- SREマネージャー チームのマネジメントや組織全体の信頼性戦略の立案・推進を担い、エンジニアの育成と組織のSRE文化醸成をリードします。
- プリンシパルエンジニア / 技術顧問 SREとAIの高度な専門性をベースに、DMMグループ全体の技術戦略に関与する社内外からも評価される上位エンジニアへのキャリアパスです。
【ポジティブな評価】
1. 働き方の柔軟性:リモートワーク導入やフレックスタイム制により、ワークライフバランスを自分でコントロールしやすいという声が多く、有給取得率も比較的高い水準との評価があります。
2. 大規模サービスでの経験:多数の事業・サービスを横断的に経験できる点が、エンジニアとしての成長機会...(ここから先は会員登録後にご覧いただけます。残り303文字)
会員登録をして、
AI 口コミ全貌をチェック!
※本資料はAIを活用して収集・整理した情報を含んでいます。正確性については適宜ご確認ください。