この記事の結論
- データエンジニアに必要なスキルは SQL/クラウドDWH/Python/ETLツール の4領域
- 全部を一気に学ぶ必要はなく、優先順位をつけて段階的に。SIer出身者なら最初の2領域で前提が活きる
- 最優先は SQL強化(Window関数・CTE)→ Snowflakeトライアル → Python基礎 → ポートフォリオ作成 の順
- 「6ヶ月で転職」は順調にいった場合の目安。私自身は遠回りもしたので、後述の注意点もあわせて読んでください
「データエンジニアになりたいけど、何から勉強すればいいかわからない」
この悩み、めちゃくちゃわかります。私もSIerからデータエンジニアに転職する前、同じ状態でした。
ネットで調べると「Python」「Snowflake」「dbt」「Airflow」「Spark」と大量の技術名が出てきて、どこから手をつければいいのか途方に暮れました。
結論から言うと、全部を一気に覚える必要はありません。 優先順位をつけて、段階的に学んでいけば大丈夫です。
この記事では、SIer出身の私が実際にたどった学習ルートをベースに、データエンジニアに必要なスキルと学習の順番を 6ヶ月のロードマップ として解説します。
ちなみに私の場合、SIer5年目で年収約400万(基本給月25万・賞与基本給4ヶ月)から、転職した事業会社のデータエンジニアで500万(初回オファー450万を交渉して500万)でした。ここで紹介する学習は、その転職に向けて実際に手を動かした内容がベースです。ただ後述するように、「6ヶ月」はあくまで順調にいった場合の目安で、私自身はエージェント選びで3ヶ月ほど遠回りしています。学習だけが転職のボトルネックではない、という点は最初に書いておきます。
データエンジニアに必要なスキルの全体像
まず全体像を把握しましょう。データエンジニアのスキルは大きく4つの領域に分かれます。
| 領域 | 内容 | SIer経験の活用度 |
|---|---|---|
| SQL・データベース設計 | データ操作の基盤、クエリ最適化 | ◎ 強み |
| ETL・データパイプライン | データ取得→変換→格納の設計 | ○ 概念は活きる |
| クラウドDWH・データ基盤 | Snowflake / BigQuery / Redshift | △ 新規学習 |
| プログラミング(Python) | データ処理・自動化スクリプト | △ 新規学習 |
SIer出身者は最初の2領域で大きなアドバンテージがあります。新しく学ぶ必要があるのは主に下2つです。
学習ロードマップ(6ヶ月計画・全体マップ)
| Phase | 期間 | 学習内容 | ゴール |
|---|---|---|---|
| 1 | 1〜2ヶ月目 | SQL力を磨く | Window関数・CTEを使いこなせる |
| 2 | 2〜3ヶ月目 | クラウドDWHを触る | Snowflake/BigQueryの違いを説明できる |
| 3 | 3〜4ヶ月目 | Python・ETLツール | pandasでデータ処理、dbt入門 |
| 4 | 4〜5ヶ月目 | ワークフローオーケストレーション | AirflowでDAGが書ける |
| 5 | 5〜6ヶ月目 | ポートフォリオ作成 | データパイプライン1本を完成させる |
なお「6ヶ月」はあくまで一例です。本業をこなしながらだとPhase 4・5あたりで失速しやすく、私の周りでも当初の想定どおり半年で動けた人ばかりではありません。仕事の繁忙期や家庭の事情で間延びするのが普通なので、「6ヶ月で結果が出なかった=向いていない」とは考えない方がいいです。期間より「途中でやめない仕組み」を作る方が効きます。
以下、各フェーズで具体的に何をやるかを解説します。
Phase 1(1〜2ヶ月目):SQL力を磨く
SIer出身者でもSQLに自信がない人は多いです。業務でSQLを書いていても、Window関数やCTEを使いこなしている人は少ないのが実情です。
やること:
Window関数(ROW_NUMBER、RANK、LAG、LEAD、SUM OVER)を完全に理解する。これはデータエンジニアの面接で必ず聞かれます。実際に私も面接で「売上の前月比を出すSQLを書いてください」と聞かれました。
CTE(WITH句)を使った複雑なクエリの書き方を身につける。サブクエリのネストを減らして、読みやすいSQLが書けるようになるだけで、実務での評価が変わります。
パフォーマンスチューニングの基礎を押さえる。実行計画の読み方、インデックスの効き方、パーティションの考え方。SIer出身者ならOracleやSQL Serverで触れたことがあるはずなので、クラウドDWHでの違いを理解すればOKです。
おすすめの学習方法: LeetCodeやHackerRankのSQL問題を1日2〜3問解く。特にMedium〜Hard問題をWindow関数で解く練習が効果的です。
Phase 2(2〜3ヶ月目):クラウドDWHを触る
SQLの基礎が固まったら、クラウドDWHを実際に触りましょう。
やること:
Snowflakeの無料トライアル(30日間)に登録して、サンプルデータでクエリを実行する。ウェアハウスのサイズ変更、ステージからのデータロード、ロールとアクセス制御の基本を理解します。
BigQueryのサンドボックス(無料枠)も触ってみる。Snowflakeとの違いを体感しておくと、面接で「なぜSnowflakeがいいのか」「BigQueryとの違いは何か」という質問に答えられます。
最低限押さえるべき概念: ウェアハウスとコンピュートの分離、ストレージとコンピュートの従量課金、タイムトラベル、ゼロコピークローン。これらはオンプレRDBにはない概念なので、意識的に学ぶ必要があります。
SnowProの学習教材を読むのもおすすめです。合格まで目指さなくても、アーキテクチャの全体像が把握できます。
Phase 3(3〜4ヶ月目):Pythonの基礎とETLツール
Pythonはデータエンジニアにとって「必須だけど、極める必要はない」スキルです。
やること:
Pythonの基礎文法(変数、リスト、辞書、関数、クラス)を押さえる。すでにVBAやShellスクリプトの経験があれば、1〜2週間で十分です。
pandasでのデータ処理を学ぶ。CSVの読み込み、データのフィルタリング、集計、結合。SQLでできることをpandasでもできるようにしておくと、実務で柔軟に対応できます。
ETLツール(Fivetran、Airbyte)の概要を理解する。実際に手を動かせなくても、「どういう仕組みでデータを取得しているか」を説明できればOKです。
dbtの入門チュートリアルをやってみる。dbtはSQLベースのデータ変換ツールで、SIer出身者には取っつきやすいです。公式のjaffle_shopチュートリアルが最適です。
Phase 4(4〜5ヶ月目):ワークフローオーケストレーション
ジョブスケジューラの進化版です。SIerでJP1や千手を使っていた人なら概念はすぐ理解できます。
やること:
Apache Airflowの基本を学ぶ。DAG(有向非巡回グラフ)の概念、タスクの依存関係の定義方法、スケジューリングの設定を理解します。
ローカル環境でAirflowを動かしてみる。Docker Composeで簡単に立ち上げられます。簡単なDAG(CSVを読み込んでDBに格納する)を1つ作るだけでも、実務のイメージが掴めます。
Prefect、Dagsterも名前と特徴だけ押さえておく。「Airflow以外の選択肢を知っている」だけで面接での印象が良くなります。
Phase 5(5〜6ヶ月目):ポートフォリオを作る
学んだスキルを統合して、小さなデータパイプラインを1つ作りましょう。
おすすめのポートフォリオ:
公開APIからデータを取得して、Snowflakeにロードして、dbtで変換して、BIツールで可視化する。この一連の流れを構築できれば、「データパイプラインを設計・構築できる人」として転職活動で大きなアピールになります。
たとえば、天気APIから毎日データを取得して、週次の天気傾向を分析するダッシュボードを作る。技術的には複雑ではありませんが、「自分でデータパイプラインを1から構築した」という実績になります。
GitHubにコードを公開して、READMEにアーキテクチャ図を載せておくと、面接で話のネタにもなります。
おすすめ学習リソース
各フェーズで実際に役立った教材をまとめます。
| カテゴリ | リソース | 特徴 |
|---|---|---|
| SQL | LeetCode(SQL問題) | Window関数・CTEの実践問題が豊富 |
| SQL | HackerRank(SQL問題) | 初級〜中級向け、レベル別 |
| Snowflake | 公式トライアル(30日無料) | サンプルデータ付きで即実践 |
| dbt | jaffle_shop チュートリアル | dbt公式の入門用プロジェクト |
| Airflow | Astronomer Academy | 無料コースが充実 |
| 全般 | Designing Data-Intensive Applications | データ基盤の原理原則を学べる名著 |
SIer出身者が最短で転職するための優先順位
全部を完璧にする必要はありません。転職活動を始めるまでに最低限必要なのは以下の3つです。
1位:SQLの強化(Window関数、CTE)。 これだけで面接の技術質問の半分は乗り切れます。
2位:Snowflakeのトライアルを触る。 「触ったことがある」と「全くない」の差は大きいです。
3位:SIer経験のデータエンジニア用語への翻訳。 技術力は同じでも、伝え方で評価が変わります。詳細は SIer出身者向けの職務経歴書の書き方 を参照してください。
Python、dbt、Airflowは「知っている」レベルでOK。入社後にキャッチアップすれば十分です。企業が求めているのは「全部できる人」ではなく「基礎があって学べる人」です。
よくある質問(FAQ)
Q. 完全未経験(IT業界以外)からデータエンジニアになれますか? A. 可能ですが、SIer出身者と比べて学習期間は長くなります。目安は 12〜18ヶ月。SQLとプログラミング基礎を半年、ポートフォリオ作成に半年、転職活動に半年というイメージです。
Q. 30代からでも転職できますか? A. できます。30代で転職した人は珍しくありません。ただし実務経験ベースで評価されるため、SIerでのデータベース運用や大規模システム経験を上手く翻訳できるかが鍵です。
Q. 文系出身でも大丈夫ですか? A. 大丈夫です。データエンジニアに高度な数学は不要です(データサイエンティストとは違います)。SQLとプログラミングは練習で身につきます。
Q. 資格は取った方がいいですか? A. 必須ではない が、SnowProやAWS Solutions Architectは学習の証明になります。ただし優先度は実務スキル > ポートフォリオ > 資格。資格取得に時間を取られすぎないように。
Q. ポートフォリオはどのくらいの規模が必要ですか? A. 小規模で十分です。「APIからデータ取得→DWHにロード→変換→可視化」の一連の流れが1本あれば、面接で語る材料になります。複雑さより「完成度」を優先してください。
Q. 学習中に並行して転職活動を始めるべきですか? A. ケースバイケースです。求人票を眺めて「実際に求められているスキル」を逆算するのは、学習の方向決めに役立ちます。一方で、学習が浅い段階で本格的に応募を始めると書類で落ち続けて消耗することもあるので、私はPhase 1〜2でSQLの土台ができてから情報収集を始める方をすすめます。なお私自身は最初の転職で、Snowflakeを知らない担当者に当たって3ヶ月ほど遠回りしました。相談相手は1社に絞らず、データ基盤の話が通じるかを早めに見極めた方がいいです(IT特化のエージェントを複数併用しました)。
まとめ
データエンジニアに必要なスキルは多岐にわたりますが、一度に全てを身につける必要はありません。
ポイントを再掲します。
- SIer出身者の強み:SQLとRDB設計の基礎、ジョブスケジューラ(JP1・千手など)の経験が活きる
- 学習の優先順位:SQL強化 → Snowflakeトライアル → Python基礎 → ETLツール → ポートフォリオ
- 「6ヶ月」は順調にいった場合の目安:本業や生活と並行すると延びるのが普通。期間にとらわれず継続できる仕組みを優先
- 求人票での逆算は有効、ただし本格応募はSQLの土台ができてから:浅い段階での連投は消耗しやすい
未経験からでも、計画的に進めればデータエンジニアへの転職は十分狙えます。一方で、私自身も学習以外(エージェント選びなど)で遠回りした部分があるので、「半年で結果が出ない=向いていない」とは思わないでください。まずはSQLの強化から始めてみてください。
具体的な年収の動き方や交渉については 【2026年版】データエンジニアの年収相場は?SIer転職で100万円アップした実体験 に、経歴の翻訳方法は SIer→データエンジニア転職の職務経歴書 にまとめています。この記事は学習ロードマップに特化しているため、特定の転職サービスへの誘導は置いていません。
▼ 関連記事
- SIerを辞めて「事業会社のデータエンジニア」に転職した話
- Snowflake未経験でもデータエンジニアに転職できた理由
- SIer→データエンジニア転職の職務経歴書|書き換え例&テンプレ付き
- 【2026年版】データエンジニアの年収相場は?SIer転職で100万円アップした実体験
- dbt入門:SIer出身者が最速で理解するためのガイド
- AI時代にデータエンジニアの仕事はどう変わる?現役が語る5つのリアルな変化


コメント