Cloudflare 502 Bad Gatewayが出たとき、最初の30分でやること

Cloudflare 502（Bad Gateway）を、直前変更/Cloudflare側の自爆/オリジン停止/上流依存で30分切り分ける。

著者: 川原更新: 2026-05-18障害対応 RSS

Xで共有 Facebook LinkedIn

料金相談

Cloudflareで 502 Bad Gateway が出たときは、まず「Cloudflareがオリジン（アプリ/リバプロ/上流）から “正しいHTTP応答” を受け取れなかった」として扱うのが最短です。

この記事は、502が出て「急に落ちた/一部だけ落ちた」状況になったとき、最初の30分で“止血”するチェックリストです。

0. まず結論（先にやる順番）

最初の30分は「直す」より「切り分けて止血」を優先します。

502で確定（Cloudflare側のエラー番号・発生URL・発生率）
影響範囲を固定（全員/一部地域/一部URL/自分だけ）
Cloudflare側の変化を見て“自爆”を除外（WAF/Transform/Redirect/Workers/キャッシュ）
オリジンの健全性を確認（ログ/メトリクス/再起動/上流依存）
直前変更の切り戻し（デプロイ/設定/依存/環境変数）

1. 502で確定する（推理禁止）

まず「本当に502か」を確定します（似た症状でも初動が変わります）。

ブラウザのエラー画面に 502 が出ているか
Cloudflareダッシュボードの Events / Analytics で、502が増えているか
もし可能なら curl -I <URL> を複数回実行し、再現率 を把握する

2. 影響範囲を固定する（最優先）

次を順に試して、影響範囲を固定します。

別端末（スマホ/PC）で同じURLを見る
別回線（モバイル回線）で見る
別リージョン（VPNなどが使えるなら）で見る
別URL（トップだけ/サブページだけ/特定パスだけ）で傾向を見る

判断の目安:

全員・全ページで502: オリジン停止/デプロイ失敗/依存障害を優先
一部パスだけ502: ルーティング/特定API/バックエンド依存（上流）を優先
自分だけ502: “502自体はサーバー側” だが、DNS/プロキシ/拡張も残す（切り分けは継続）

3. Cloudflare側の“直前変更”を確認する（自爆の除外）

502はオリジン側が原因のことが多いですが、Cloudflare側の設定変更で“自爆”していることもあります。

最優先で見るもの:

直近で WAF / Firewall / Rate Limit を触っていないか
直近で Redirect Rules / Transform Rules を触っていないか（無限リダイレクト/ヘッダー破壊）
直近で Workers / Pages Functions / Routes を触っていないか（例外で502扱いになることがあります）
直近で キャッシュ 周り（Cache Rules/Bypass/HTMLキャッシュ）を触っていないか

「直前変更と時刻が一致」するなら、原因が完全に特定できなくても 切り戻し の方が早いです。

4. オリジン（アプリ/リバプロ/上流）を“落ちている前提”で確認する

502は「オリジンが 落ちた/壊れた/過負荷で応答が崩れた」ときに起きやすいです。

チェックリスト:

オリジンが生きているか（プロセス/Pod/VM/コンテナの 再起動ループ がないか）
アプリ/リバプロ（Nginx等）のログで 5xx/例外/接続リセット が増えていないか
CPU/メモリ/コネクション数/DB接続数 が跳ねていないか
上流依存（DB/外部API/決済/メール/ストレージ）が落ちていないか

5. “一部URLだけ502”のときの最短切り分け

パスやホストで偏るなら、原因はだいたい「そのパスだけ通る上流」です。

そのパスが叩く API/DB/外部サービス は何か
そのパスだけ リダイレクト/認証/ミドルウェア が入っていないか
そのパスだけ 巨大レスポンス になっていないか（上流タイムアウト→応答崩れ）

6. 最短の止血（30分の範囲）

原因特定に時間がかかるときは、復旧優先で止血します。

直前のデプロイをロールバック
直前の設定変更（Workers/Routes/WAF/Redirect/Transform）を戻す
依存障害が疑わしい場合は、機能を落としてでも「トップと主要導線だけ生かす」（障害の波及を止める）
過負荷が疑わしい場合は、レート制限/キャッシュ/上流のタイムアウト調整で止血（根治は後）

7. 再発防止（30分の外）

復旧後に、次のどれかを最低1つ入れると再発率が下がります。

直近デプロイの「変更点」と「ロールバック手順」を最短で引ける状態にする
502発生時に参照する オリジンログ/メトリクス を固定する
重要な上流依存に タイムアウト/リトライ/フォールバック を入れる

状況が再現しない/原因が複合している場合は、相談だけ先に進めるのも有効です。

この記事を書いた人

川原

SiteOps編集チームの公開窓口として、検索、アクセス、収益データをもとにした運営判断の知見をまとめています。

著者情報

Cloudflare 504 Gateway Timeoutが出たとき、最初の30分でやること障害対応更新: 2026-05-18 Cloudflare 520（Web server returned an unknown error）が出たとき、最初の30分でやること障害対応更新: 2026-05-18 Cloudflare 521（Web server is down）が出たとき、最初の30分でやること障害対応更新: 2026-05-18

次にやること

複数サイトの検索、アクセス、収益データをまとめて見直すなら、SiteOpsのダッシュボードでサイト別に確認できます。

料金を見る相談したい / お問い合わせ

記事一覧

Cloudflare 502 Bad Gatewayが出たとき、最初の30分でやること

Cloudflare 502（Bad Gateway）を、直前変更/Cloudflare側の自爆/オリジン停止/上流依存で30分切り分ける。

著者: 川原更新: 2026-05-18障害対応 RSS

Xで共有 Facebook LinkedIn

料金相談

この記事は、502が出て「急に落ちた/一部だけ落ちた」状況になったとき、最初の30分で“止血”するチェックリストです。

0. まず結論（先にやる順番）

最初の30分は「直す」より「切り分けて止血」を優先します。

502で確定（Cloudflare側のエラー番号・発生URL・発生率）
影響範囲を固定（全員/一部地域/一部URL/自分だけ）
Cloudflare側の変化を見て“自爆”を除外（WAF/Transform/Redirect/Workers/キャッシュ）
オリジンの健全性を確認（ログ/メトリクス/再起動/上流依存）
直前変更の切り戻し（デプロイ/設定/依存/環境変数）

1. 502で確定する（推理禁止）

まず「本当に502か」を確定します（似た症状でも初動が変わります）。

ブラウザのエラー画面に 502 が出ているか
Cloudflareダッシュボードの Events / Analytics で、502が増えているか
もし可能なら curl -I <URL> を複数回実行し、再現率 を把握する

2. 影響範囲を固定する（最優先）

次を順に試して、影響範囲を固定します。

別端末（スマホ/PC）で同じURLを見る
別回線（モバイル回線）で見る
別リージョン（VPNなどが使えるなら）で見る
別URL（トップだけ/サブページだけ/特定パスだけ）で傾向を見る

判断の目安:

全員・全ページで502: オリジン停止/デプロイ失敗/依存障害を優先
一部パスだけ502: ルーティング/特定API/バックエンド依存（上流）を優先
自分だけ502: “502自体はサーバー側” だが、DNS/プロキシ/拡張も残す（切り分けは継続）

3. Cloudflare側の“直前変更”を確認する（自爆の除外）

502はオリジン側が原因のことが多いですが、Cloudflare側の設定変更で“自爆”していることもあります。

最優先で見るもの:

直近で WAF / Firewall / Rate Limit を触っていないか
直近で Redirect Rules / Transform Rules を触っていないか（無限リダイレクト/ヘッダー破壊）
直近で Workers / Pages Functions / Routes を触っていないか（例外で502扱いになることがあります）
直近で キャッシュ 周り（Cache Rules/Bypass/HTMLキャッシュ）を触っていないか

「直前変更と時刻が一致」するなら、原因が完全に特定できなくても 切り戻し の方が早いです。

4. オリジン（アプリ/リバプロ/上流）を“落ちている前提”で確認する

502は「オリジンが 落ちた/壊れた/過負荷で応答が崩れた」ときに起きやすいです。

チェックリスト:

オリジンが生きているか（プロセス/Pod/VM/コンテナの 再起動ループ がないか）
アプリ/リバプロ（Nginx等）のログで 5xx/例外/接続リセット が増えていないか
CPU/メモリ/コネクション数/DB接続数 が跳ねていないか
上流依存（DB/外部API/決済/メール/ストレージ）が落ちていないか

5. “一部URLだけ502”のときの最短切り分け

パスやホストで偏るなら、原因はだいたい「そのパスだけ通る上流」です。

そのパスが叩く API/DB/外部サービス は何か
そのパスだけ リダイレクト/認証/ミドルウェア が入っていないか
そのパスだけ 巨大レスポンス になっていないか（上流タイムアウト→応答崩れ）

6. 最短の止血（30分の範囲）

原因特定に時間がかかるときは、復旧優先で止血します。

直前のデプロイをロールバック
直前の設定変更（Workers/Routes/WAF/Redirect/Transform）を戻す
依存障害が疑わしい場合は、機能を落としてでも「トップと主要導線だけ生かす」（障害の波及を止める）
過負荷が疑わしい場合は、レート制限/キャッシュ/上流のタイムアウト調整で止血（根治は後）

7. 再発防止（30分の外）

復旧後に、次のどれかを最低1つ入れると再発率が下がります。

直近デプロイの「変更点」と「ロールバック手順」を最短で引ける状態にする
502発生時に参照する オリジンログ/メトリクス を固定する
重要な上流依存に タイムアウト/リトライ/フォールバック を入れる

状況が再現しない/原因が複合している場合は、相談だけ先に進めるのも有効です。

この記事を書いた人

川原

SiteOps編集チームの公開窓口として、検索、アクセス、収益データをもとにした運営判断の知見をまとめています。

著者情報

次にやること

複数サイトの検索、アクセス、収益データをまとめて見直すなら、SiteOpsのダッシュボードでサイト別に確認できます。

料金を見る相談したい / お問い合わせ

Cloudflare 502 Bad Gatewayが出たとき、最初の30分でやること

0. まず結論（先にやる順番）

1. 502で確定する（推理禁止）

2. 影響範囲を固定する（最優先）

3. Cloudflare側の“直前変更”を確認する（自爆の除外）

4. オリジン（アプリ/リバプロ/上流）を“落ちている前提”で確認する

5. “一部URLだけ502”のときの最短切り分け

6. 最短の止血（30分の範囲）

7. 再発防止（30分の外）

川原

関連記事

次にやること

Cloudflare 502 Bad Gatewayが出たとき、最初の30分でやること

0. まず結論（先にやる順番）

1. 502で確定する（推理禁止）

2. 影響範囲を固定する（最優先）

3. Cloudflare側の“直前変更”を確認する（自爆の除外）

4. オリジン（アプリ/リバプロ/上流）を“落ちている前提”で確認する

5. “一部URLだけ502”のときの最短切り分け

6. 最短の止血（30分の範囲）

7. 再発防止（30分の外）

川原

関連記事

次にやること