Azure OpenAI利用料

2023年6月5日

前提

モデルはgpt-35-turbo

課金対象は2種類

・prompt_tokens: APIへのリクエストに使われたトークンの数。システム、ユーザー、そしてAIアシスタントのメッセージ全てを含みます。
・completion_tokens: APIから返されたレスポンス(AIアシスタントのメッセージ)に含まれるトークンの数。
(total_tokens: prompt_tokensとcompletion_tokensの合計))

※過去のAIとのやりとり含めて、AzureOpenAIにHTTP Postしようとすると、prompt_tokensとして、過去のAIやり取り分も課金対象になるので注意が必要

こんな感じでAzureOpneAIからレスポンスがあります。

太字部分が、トークン消費量ですね。

{

  “id": “chatcmpl-×××",

  “object": “chat.completion",

  “created": 1685929277,

  “model": “gpt-35-turbo",

  “choices": [

    {

      “index": 0,

      “finish_reason": “stop",

      “message": {

        “role": “assistant",

        “content": “AIからの回答はここに入ります"

      }

    }

  ],

  “usage": {

    “completion_tokens": 133,

    “prompt_tokens": 5056,

    “total_tokens": 5189

  }

}