ジュニア SRE(0〜1年)
Linux の基本操作とネットワークの仕組みを理解し、既存の監視ダッシュボードやアラートの意味を読み解けるようになるフェーズ。簡単なシェルスクリプトで定型作業を自動化し、先輩エンジニアのインシデント対応を横で見ながらオペレーションの肌感覚を養う。
このステップで身につけるスキル
- Linux / Unix システム管理
- ネットワーク設計・トラブルシュート
- シェルスクリプト・自動化
システムの信頼性・可用性・パフォーマンスを設計・運用の両面から支えるエンジニア職種。
0年目から到達点まで、4つのフェーズで何を学ぶべきかが一望できます。
年次ごとに最適な推薦書籍を提示。書影・著者・難易度つきで迷わず選べます。
12つの主要スキルを段階的に積み上げ、市場価値を最大化していくロードマップです。
システムの信頼性・可用性・パフォーマンスを設計・運用の両面から支えるエンジニア職種。ソフトウェアエンジニアリングのアプローチでインフラ課題を解決する。
0年目から到達点まで、4段階のキャリアパスを年次ごとに分解。各ステップで身につけるスキル・読むべき書籍を時系列で把握できます。
Linux の基本操作とネットワークの仕組みを理解し、既存の監視ダッシュボードやアラートの意味を読み解けるようになるフェーズ。簡単なシェルスクリプトで定型作業を自動化し、先輩エンジニアのインシデント対応を横で見ながらオペレーションの肌感覚を養う。
Kubernetes を用いたコンテナ運用と Terraform による IaC を実践し、再現可能なインフラ構築を自力で行えるレベルを目指す。オブザーバビリティの三本柱を理解し、SLO/SLI の定義と計測を主体的に提案できるようになることが重要になる。
組織横断でアーキテクチャの信頼性を設計し、エラーバジェットに基づいた意思決定をリードする段階。大規模障害のインシデントコマンダーを務め、ポストモーテムを通じて組織の学習文化を醸成する。CI/CD パイプラインの高度な最適化やマルチクラウド戦略の立案も担う。
SRE チームのビジョン策定と組織設計を担い、信頼性を経営課題として位置づけるフェーズ。エラーバジェットポリシーの全社展開、プラットフォームチームとの連携、採用・育成計画の立案を通じて、技術的リーダーシップとピープルマネジメントの両面で組織に貢献する。
この職種で求められるスキルを、推奨レベルと参考書籍とともに一覧化しています。
| スキル | 推奨レベル | 推奨書籍 |
|---|---|---|
| スキル セキュリティ基盤設計 | 推奨レベル 初級 | 推奨書籍 — |
| スキル シェルスクリプト・自動化 | 推奨レベル 初級 | 推奨書籍 — |
| スキル Linux / Unix システム管理 | 推奨レベル 中級 | 推奨書籍 — |
| スキル コンテナオーケストレーション(Kubernetes) | 推奨レベル 中級 | 推奨書籍 — |
| スキル オブザーバビリティ設計 | 推奨レベル 中級 | 推奨書籍 |
| スキル Infrastructure as Code | 推奨レベル 中級 | 推奨書籍 — |
| スキル クラウドアーキテクチャ設計 | 推奨レベル 中級 | 推奨書籍 — |
| スキル ネットワーク設計・トラブルシュート | 推奨レベル 中級 | 推奨書籍 — |
| スキル CI/CD パイプライン構築 | 推奨レベル 中級 | 推奨書籍 — |
| スキル インシデント対応・ポストモーテム | 推奨レベル 上級 | 推奨書籍 — |
| スキル SLO/SLI 設計・エラーバジェット運用 | 推奨レベル 上級 | 推奨書籍 — |
| スキル パフォーマンス分析・チューニング | 推奨レベル 上級 | 推奨書籍 |
ステップごとに到達可能な年収帯の目安。経験・実績の積み上げに応じて市場価値が上昇していきます。
※ 公開求人データ・各種職種調査をもとにした参考値です。実際の年収は企業規模・地域・経験により大きく変動します。
SRE(Site Reliability Engineer)を目指す代表的なロールモデル。あなたに近いキャリアパスを参考にしてください。
SREにはインフラの知識とソフトウェアエンジニアリングの両方のスキルが求められます。具体的には、Linux・ネットワークの基礎、クラウド(AWS/GCP/Azure)の運用経験、Infrastructure as Code(Terraform等)、監視・モニタリング(Prometheus、Grafana等)、そしてPythonやGoでの自動化スクリプト開発力が重要です。「運用をコードで解決する」というマインドセットがSREの核心です。
インフラ未経験の場合、1年〜1年半程度の学習期間を見込むのが現実的です。まずLinuxとネットワークの基礎を3ヶ月で固め、次にAWSやGCPの認定資格を取得しながらクラウド環境の構築経験を積みましょう。並行してDockerやKubernetesのハンズオン学習を進め、最後にTerraformでのIaC実践やCI/CDパイプラインの構築に取り組みます。インフラエンジニアやバックエンドエンジニアからの転身であれば、3〜6ヶ月で準備可能です。
SREの年収は600万円〜1,500万円と高水準です。SREは高度な専門性が求められるため、ジュニアでも600万円前後からスタートするケースが多いです。3〜5年の実務経験で800万〜1,200万円、大規模サービスのSREリードやマネージャーでは1,500万円以上も珍しくありません。特にKubernetesやマイクロサービスの運用経験があるSREは市場で非常に希少で、高い報酬を得やすいポジションです。
従来のインフラエンジニアがサーバーやネットワークの構築・運用を手動で行うのに対し、SREはソフトウェアエンジニアリングの手法でインフラの信頼性を向上させます。SREはSLI/SLO(サービスレベル指標・目標)の設定、エラーバジェットによるリスク管理、トイル(手作業)の自動化を体系的に行います。Googleが提唱した「運用はソフトウェアの問題である」という考え方がSREの原点であり、コードを書ける運用エンジニアという位置づけです。
最もよくある失敗は、ツールの使い方だけ覚えて本質的な考え方を理解しないことです。KubernetesやTerraformを触れるだけでは不十分で、「なぜそのツールを使うのか」「SLOをどう設計するか」といった設計思想の理解が重要です。また、プログラミングスキルを軽視して運用知識だけで勝負しようとするのも失敗の原因です。SREは「コードで問題を解決する」職種なので、Python・Goでの自動化スキルは必須と考えましょう。
SRE(Site Reliability Engineer)と関連の深い職種。キャリアの幅を広げる選択肢として検討できます。
このロードマップで言及されている全4冊の書籍をユニークにまとめています。