Mistral Official Docs

Pixtral Large

mistral-large-pixtral-2411

active

Pixtral Large

Pixtral Large is a vision-capable large model with frontier reasoning capabilities, making it well-suited for a wide range of multimodal tasks.

Supports a 131K token context window. Handles Text, Image, Video, Audio, Transcription, Text-to-Speech inputs and outputs. Supports fine-tuning for custom applications. Supports tool use for advanced automation. Capable of generating structured output formats.

Model Timeline

Launch Date

11/1/2024

Last Updated

11/1/2024

Capabilities

Text

Input Pricing

$-/ KTok

Context: 131,072 tokens

Output Pricing

$-/ KTok

Vision Capabilities

Image

Input Pricing

85 tokens/image

Embeddings

Embeddings Pricing

$0.10/1k tokens

Additional Model Information

Tool Use

Yes

Structured Output

Yes

Reasoning

Yes

Mistral Official Docs

Pixtral Large

Pixtral Large

Model Timeline

Launch Date

Last Updated

Capabilities

Text

Input Pricing

Output Pricing

Vision Capabilities

Image

Input Pricing

Embeddings

Embeddings Pricing

Additional Model Information

Tool Use

Structured Output

Reasoning

Anthropic

Cohere

DeepSeek

Google Vertex AI

Groq

Mistral

OpenAI

X.AI

Model Timeline

Launch Date

Last Updated

Capabilities

Text

Input Pricing

Output Pricing

Vision Capabilities

Image

Input Pricing

Embeddings

Embeddings Pricing

Additional Model Information

Tool Use

Structured Output

Reasoning

Flatten your repo for AI in seconds

Anthropic

Cohere

DeepSeek

Google Vertex AI

Groq

Mistral

OpenAI

X.AI