トークンとは
トークンは、大規模言語モデル(LLM)がテキストを処理する際の最小単位です。モデルの入出力量や料金はトークン数で計算されます。
トークン数の目安
- 英語: 1単語 ≈ 1-1.5トークン
- 日本語: 1文字 ≈ 1-2トークン(漢字・ひらがなで異なる)
- 1,000トークン ≈ 日本語約500-700文字
コスト計算での重要性
AnthropicのClaude APIなど、LLMの利用料金は入力トークン数と出力トークン数に基づいて計算されます。Batch APIを使うと50%の割引が適用されます。
コンテキストウィンドウ
モデルが一度に処理できるトークン数の上限をコンテキストウィンドウと呼びます。Claude Opus 4は最大100万トークンのコンテキストに対応しています。