OpenAI Official Docs

GPT-4o Realtime Preview

gpt-4o-realtime-preview-2024-10-01

active

GPT-4o Realtime Preview

A powerful AI model capable of handling real-time text and audio inputs and outputs, with a wide range of capabilities including text, image, video, audio, transcription, and text-to-speech.

Supports a variable token context window. Handles Text, Image, Video, Audio, Transcription, Text-to-Speech inputs and outputs. Supports fine-tuning for custom applications. Supports tool use for advanced automation. Capable of generating structured output formats.

Model Timeline

Launch Date

10/1/2024

Capabilities

Text

Input Pricing

$5.00/ MTok

Context: N/A tokens

Output Pricing

$20.00/ MTok

Image

Input Pricing

85 tokens/image

Video

Input Pricing

$0.0025/second

Audio

Input Pricing

$ 0.006 /minute

Generation Pricing

$0.01 /minute

Transcription

Transcription Pricing

$0.006/minute

Text-to-Speech

Text-to-Speech Pricing

$0.01/1k characters

Embeddings

Embeddings Pricing

$0.13/1k tokens

Fine-Tuning

Fine-Tuning Pricing

$25.00/MTok training

Additional Model Information

Tool Use

Yes

Structured Output

Yes

Reasoning

Yes

OpenAI Official Docs

GPT-4o Realtime Preview

GPT-4o Realtime Preview

Model Timeline

Launch Date

Capabilities

Text

Input Pricing

Output Pricing

Image

Input Pricing

Video

Input Pricing

Audio

Input Pricing

Generation Pricing

Transcription

Transcription Pricing

Text-to-Speech

Text-to-Speech Pricing

Embeddings

Embeddings Pricing

Fine-Tuning

Fine-Tuning Pricing

Additional Model Information

Tool Use

Structured Output

Reasoning

Anthropic

Cohere

DeepSeek

Google Vertex AI

Groq

Mistral

OpenAI

X.AI

Model Timeline

Launch Date

Capabilities

Text

Input Pricing

Output Pricing

Image

Input Pricing

Video

Input Pricing

Audio

Input Pricing

Generation Pricing

Transcription

Transcription Pricing

Text-to-Speech

Text-to-Speech Pricing

Embeddings

Embeddings Pricing

Fine-Tuning

Fine-Tuning Pricing

Additional Model Information

Tool Use

Structured Output

Reasoning

Flatten your repo for AI in seconds

Anthropic

Cohere

DeepSeek

Google Vertex AI

Groq

Mistral

OpenAI

X.AI