【2026年版】データエンジニアのロードマップ｜未経験から必要なスキルと学習順序

この記事の結論

データエンジニアに必要なスキルは SQL／クラウドDWH／Python／ETLツール の4領域
全部を一気に学ぶ必要はなく、優先順位をつけて段階的に。SIer出身者なら最初の2領域で前提が活きる
最優先は SQL強化（Window関数・CTE）→ Snowflakeトライアル → Python基礎 → ポートフォリオ作成 の順
「6ヶ月で転職」は順調にいった場合の目安。私自身は遠回りもしたので、後述の注意点もあわせて読んでください

「データエンジニアになりたいけど、何から勉強すればいいかわからない」

この悩み、めちゃくちゃわかります。私もSIerからデータエンジニアに転職する前、同じ状態でした。

ネットで調べると「Python」「Snowflake」「dbt」「Airflow」「Spark」と大量の技術名が出てきて、どこから手をつければいいのか途方に暮れました。

結論から言うと、全部を一気に覚える必要はありません。 優先順位をつけて、段階的に学んでいけば大丈夫です。

この記事では、SIer出身の私が実際にたどった学習ルートをベースに、データエンジニアに必要なスキルと学習の順番を 6ヶ月のロードマップ として解説します。

ちなみに私の場合、SIer5年目で年収約400万（基本給月25万・賞与基本給4ヶ月）から、転職した事業会社のデータエンジニアで500万（初回オファー450万を交渉して500万）でした。ここで紹介する学習は、その転職に向けて実際に手を動かした内容がベースです。ただ後述するように、「6ヶ月」はあくまで順調にいった場合の目安で、私自身はエージェント選びで3ヶ月ほど遠回りしています。学習だけが転職のボトルネックではない、という点は最初に書いておきます。

データエンジニアに必要なスキルの全体像
学習ロードマップ（6ヶ月計画・全体マップ）
おすすめ学習リソース
SIer出身者が最短で転職するための優先順位
よくある質問（FAQ）
まとめ

データエンジニアに必要なスキルの全体像

まず全体像を把握しましょう。データエンジニアのスキルは大きく4つの領域に分かれます。

領域	内容	SIer経験の活用度
SQL・データベース設計	データ操作の基盤、クエリ最適化	◎ 強み
ETL・データパイプライン	データ取得→変換→格納の設計	○ 概念は活きる
クラウドDWH・データ基盤	Snowflake / BigQuery / Redshift	△ 新規学習
プログラミング（Python）	データ処理・自動化スクリプト	△ 新規学習

SIer出身者は最初の2領域で大きなアドバンテージがあります。新しく学ぶ必要があるのは主に下2つです。

学習ロードマップ（6ヶ月計画・全体マップ）

Phase	期間	学習内容	ゴール
1	1〜2ヶ月目	SQL力を磨く	Window関数・CTEを使いこなせる
2	2〜3ヶ月目	クラウドDWHを触る	Snowflake/BigQueryの違いを説明できる
3	3〜4ヶ月目	Python・ETLツール	pandasでデータ処理、dbt入門
4	4〜5ヶ月目	ワークフローオーケストレーション	AirflowでDAGが書ける
5	5〜6ヶ月目	ポートフォリオ作成	データパイプライン1本を完成させる

なお「6ヶ月」はあくまで一例です。本業をこなしながらだとPhase 4・5あたりで失速しやすく、私の周りでも当初の想定どおり半年で動けた人ばかりではありません。仕事の繁忙期や家庭の事情で間延びするのが普通なので、「6ヶ月で結果が出なかった＝向いていない」とは考えない方がいいです。期間より「途中でやめない仕組み」を作る方が効きます。

以下、各フェーズで具体的に何をやるかを解説します。

Phase 1（1〜2ヶ月目）：SQL力を磨く

SIer出身者でもSQLに自信がない人は多いです。業務でSQLを書いていても、Window関数やCTEを使いこなしている人は少ないのが実情です。

やること：

Window関数（ROW_NUMBER、RANK、LAG、LEAD、SUM OVER）を完全に理解する。これはデータエンジニアの面接で必ず聞かれます。実際に私も面接で「売上の前月比を出すSQLを書いてください」と聞かれました。

CTE（WITH句）を使った複雑なクエリの書き方を身につける。サブクエリのネストを減らして、読みやすいSQLが書けるようになるだけで、実務での評価が変わります。

パフォーマンスチューニングの基礎を押さえる。実行計画の読み方、インデックスの効き方、パーティションの考え方。SIer出身者ならOracleやSQL Serverで触れたことがあるはずなので、クラウドDWHでの違いを理解すればOKです。

おすすめの学習方法： LeetCodeやHackerRankのSQL問題を1日2〜3問解く。特にMedium〜Hard問題をWindow関数で解く練習が効果的です。

Phase 2（2〜3ヶ月目）：クラウドDWHを触る

SQLの基礎が固まったら、クラウドDWHを実際に触りましょう。

やること：

Snowflakeの無料トライアル（30日間）に登録して、サンプルデータでクエリを実行する。ウェアハウスのサイズ変更、ステージからのデータロード、ロールとアクセス制御の基本を理解します。

BigQueryのサンドボックス（無料枠）も触ってみる。Snowflakeとの違いを体感しておくと、面接で「なぜSnowflakeがいいのか」「BigQueryとの違いは何か」という質問に答えられます。

最低限押さえるべき概念： ウェアハウスとコンピュートの分離、ストレージとコンピュートの従量課金、タイムトラベル、ゼロコピークローン。これらはオンプレRDBにはない概念なので、意識的に学ぶ必要があります。

SnowProの学習教材を読むのもおすすめです。合格まで目指さなくても、アーキテクチャの全体像が把握できます。

Phase 3（3〜4ヶ月目）：Pythonの基礎とETLツール

Pythonはデータエンジニアにとって「必須だけど、極める必要はない」スキルです。

やること：

Pythonの基礎文法（変数、リスト、辞書、関数、クラス）を押さえる。すでにVBAやShellスクリプトの経験があれば、1〜2週間で十分です。

pandasでのデータ処理を学ぶ。CSVの読み込み、データのフィルタリング、集計、結合。SQLでできることをpandasでもできるようにしておくと、実務で柔軟に対応できます。

ETLツール（Fivetran、Airbyte）の概要を理解する。実際に手を動かせなくても、「どういう仕組みでデータを取得しているか」を説明できればOKです。

dbtの入門チュートリアルをやってみる。dbtはSQLベースのデータ変換ツールで、SIer出身者には取っつきやすいです。公式のjaffle_shopチュートリアルが最適です。

Phase 4（4〜5ヶ月目）：ワークフローオーケストレーション

ジョブスケジューラの進化版です。SIerでJP1や千手を使っていた人なら概念はすぐ理解できます。

やること：

Apache Airflowの基本を学ぶ。DAG（有向非巡回グラフ）の概念、タスクの依存関係の定義方法、スケジューリングの設定を理解します。

ローカル環境でAirflowを動かしてみる。Docker Composeで簡単に立ち上げられます。簡単なDAG（CSVを読み込んでDBに格納する）を1つ作るだけでも、実務のイメージが掴めます。

Prefect、Dagsterも名前と特徴だけ押さえておく。「Airflow以外の選択肢を知っている」だけで面接での印象が良くなります。

Phase 5（5〜6ヶ月目）：ポートフォリオを作る

学んだスキルを統合して、小さなデータパイプラインを1つ作りましょう。

おすすめのポートフォリオ：

公開APIからデータを取得して、Snowflakeにロードして、dbtで変換して、BIツールで可視化する。この一連の流れを構築できれば、「データパイプラインを設計・構築できる人」として転職活動で大きなアピールになります。

たとえば、天気APIから毎日データを取得して、週次の天気傾向を分析するダッシュボードを作る。技術的には複雑ではありませんが、「自分でデータパイプラインを1から構築した」という実績になります。

GitHubにコードを公開して、READMEにアーキテクチャ図を載せておくと、面接で話のネタにもなります。

カテゴリ	リソース	特徴
SQL	LeetCode（SQL問題）	Window関数・CTEの実践問題が豊富
SQL	HackerRank（SQL問題）	初級〜中級向け、レベル別
Snowflake	公式トライアル（30日無料）	サンプルデータ付きで即実践
dbt	jaffle_shop チュートリアル	dbt公式の入門用プロジェクト
Airflow	Astronomer Academy	無料コースが充実
全般	Designing Data-Intensive Applications	データ基盤の原理原則を学べる名著

SIer出身者が最短で転職するための優先順位

全部を完璧にする必要はありません。転職活動を始めるまでに最低限必要なのは以下の3つです。

1位：SQLの強化（Window関数、CTE）。 これだけで面接の技術質問の半分は乗り切れます。

2位：Snowflakeのトライアルを触る。 「触ったことがある」と「全くない」の差は大きいです。

3位：SIer経験のデータエンジニア用語への翻訳。 技術力は同じでも、伝え方で評価が変わります。詳細は SIer出身者向けの職務経歴書の書き方を参照してください。

Python、dbt、Airflowは「知っている」レベルでOK。入社後にキャッチアップすれば十分です。企業が求めているのは「全部できる人」ではなく「基礎があって学べる人」です。

よくある質問（FAQ）

Q. 完全未経験（IT業界以外）からデータエンジニアになれますか？ A. 可能ですが、SIer出身者と比べて学習期間は長くなります。目安は 12〜18ヶ月。SQLとプログラミング基礎を半年、ポートフォリオ作成に半年、転職活動に半年というイメージです。

Q. 30代からでも転職できますか？ A. できます。30代で転職した人は珍しくありません。ただし実務経験ベースで評価されるため、SIerでのデータベース運用や大規模システム経験を上手く翻訳できるかが鍵です。

Q. 文系出身でも大丈夫ですか？ A. 大丈夫です。データエンジニアに高度な数学は不要です（データサイエンティストとは違います）。SQLとプログラミングは練習で身につきます。

Q. 資格は取った方がいいですか？ A. 必須ではない が、SnowProやAWS Solutions Architectは学習の証明になります。ただし優先度は実務スキル > ポートフォリオ > 資格。資格取得に時間を取られすぎないように。

Q. ポートフォリオはどのくらいの規模が必要ですか？ A. 小規模で十分です。「APIからデータ取得→DWHにロード→変換→可視化」の一連の流れが1本あれば、面接で語る材料になります。複雑さより「完成度」を優先してください。

Q. 学習中に並行して転職活動を始めるべきですか？ A. ケースバイケースです。求人票を眺めて「実際に求められているスキル」を逆算するのは、学習の方向決めに役立ちます。一方で、学習が浅い段階で本格的に応募を始めると書類で落ち続けて消耗することもあるので、私はPhase 1〜2でSQLの土台ができてから情報収集を始める方をすすめます。なお私自身は最初の転職で、Snowflakeを知らない担当者に当たって3ヶ月ほど遠回りしました。相談相手は1社に絞らず、データ基盤の話が通じるかを早めに見極めた方がいいです（IT特化のエージェントを複数併用しました）。