How do I access GPT Audio Mini?

It is offered by OpenAI and accessible via their developer platform and API.

What is the pricing for GPT Audio Mini?

Specific pricing is not detailed in the model description and should be checked directly with OpenAI based on usage.

What types of tasks is GPT Audio Mini best suited for?

As an audio-type model it focuses on audio processing, transcription, and related analysis workloads.

Does GPT Audio Mini require any special setup for audio files?

Standard API integration from OpenAI is used to upload and process audio content.

GPT Audio Mini by OpenAI — Specs, Pricing, Benchmarks (2026)

About GPT Audio Mini

Built by OpenAI, GPT Audio Mini combines text and audio modalities in a single system. Its 128000-token context supports extended audio transcripts or mixed conversations. The model remains closed-source with parameters undisclosed.

It excels at tasks that blend spoken audio with textual instructions. Typical usage includes audio analysis, transcription support, and interactive voice scenarios where large context matters.

Capabilities

Audio input and output processing

Text-audio multimodal understanding

Long-context audio reasoning

Speech transcription and synthesis

Conversational audio interactions

Audio content analysis over extended sequences

Best for

Extended Audio Transcription

The model handles transcription of lengthy recordings like conferences or interviews by leveraging its 128000-token context window to maintain accuracy across long sessions.

Podcast and Meeting Summarization

It processes full audio files from podcasts or business meetings to generate structured summaries while retaining key details from the entire input.

Audio Analysis in Research

Researchers can use it to analyze spoken content in academic or qualitative studies, drawing insights from large volumes of audio data in a single pass.

Strengths & limitations

Strengths

+Seamless integration of text and audio modalities
+Efficient handling of large audio contexts
+Optimized for audio-centric tasks
+Built on established OpenAI GPT architecture

Limitations

–Smaller model scale may reduce depth on complex non-audio tasks
–No vision or other non-text modalities supported
–Audio focus could limit general-purpose versatility

Cost calculator

Estimate what GPT Audio Mini would cost for your usage.

Input tokens / requestOutput tokens / requestRequests / month

$0.00180

per request

$18

estimated / month

Based on GPT Audio Mini's $0.60/1M input · $2.40/1M output. Estimate only — actual cost varies by provider and caching.

Quick start

OpenRouter's API is OpenAI-compatible — most SDKs work by just swapping the base URL. Only the model slug changes between models.

JavaScript · openai

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://openrouter.ai/api/v1",
  apiKey: process.env.OPENROUTER_API_KEY,
});

const completion = await client.chat.completions.create({
  model: "openai/gpt-audio-mini",
  messages: [{ role: "user", content: "Hello!" }],
});

console.log(completion.choices[0].message.content);

Model slug: openai/gpt-audio-mini

Editor's verdict

Our take on GPT Audio Mini

GPT Audio Mini is OpenAI's proprietary audio & music with a 128K-token context window.

At $2.40 per 1M output tokens, it is mid-priced for its class.

It is available through OpenAI's API and aggregators like OpenRouter.

Best suited to seamless integration of text and audio modalities and efficient handling of large audio contexts.

Did you find this helpful?

Frequently asked questions

The model provides a context window of 128000 tokens for processing audio inputs.

User reviews

Real, verified reviews from the community shape this model's rating.

Other audio & music worth comparing.

Lyria 3 Clip Preview

Google · Audio & Music

Verified

Google's multimodal preview model for generating audio clips from text and images.

Closed1049K ctxFree

Lyria 3 Pro Preview

Google · Audio & Music

Verified

Google's advanced preview model for multimodal audio generation and editing.

Closed1049K ctxFree

GPT Audio

OpenAI · Audio & Music

Verified

OpenAI's GPT Audio processes text and audio with a 128k token context.

Closed128K ctx$10.00/1M out

GPT Audio Mini

About GPT Audio Mini

Capabilities

Best for

Extended Audio Transcription

Podcast and Meeting Summarization

Audio Analysis in Research

Strengths & limitations

Strengths

Limitations

Cost calculator

Quick start

Editor's verdict

Frequently asked questions

What context length does GPT Audio Mini support?

How do I access GPT Audio Mini?

What is the pricing for GPT Audio Mini?

What types of tasks is GPT Audio Mini best suited for?

Does GPT Audio Mini require any special setup for audio files?

User reviews

Other GPT models

GPT-5.5

GPT-5 Mini

GPT-5 Pro

GPT-5.3-Codex

GPT-5.2 Pro

GPT-5 Codex

Similar models

Lyria 3 Clip Preview

Lyria 3 Pro Preview

GPT Audio

Promote GPT Audio Mini