レートリミット(Rate Limit)は、APIサーバーが特定の時間枠内で受け付けるリクエスト数やデータ量の上限です。サーバーの安定稼働を維持し、特定のユーザーによるリソースの独占を防ぐために設けられています。

Anthropic APIでは、アカウントのTier(利用実績に基づくランク)ごとにリミットが異なります。制限の対象は主に「1分あたりのリクエスト数(RPM)」と「1分あたりの入出力トークン数(TPM)」の2軸です。

レートリミットに到達すると、APIはHTTP 429(Too Many Requests)ステータスコードを返します。レスポンスヘッダーのretry-afterフィールドに推奨される待機秒数が含まれるため、リトライ実装ではこの値を参照するのが確実です。

Anthropicのレートリミット詳細で最新のTier別上限値を確認できます。