Model Architecture: mistralai/Voxtral-Mini-3B-2507

📊 Model Parameters

Total Parameters 4,676,271,104

Context Length 2,048

Hidden Size 3072

Layers 0

Attention Heads 0

KV Heads 0

FP32 (Full) 17.42 GB

FP16 (Half) 8.71 GB

INT8 (Quantized) 4.36 GB

INT4 (Quantized) 2.18 GB

Per Token (FP16) 0 B

Max Context FP32 0.0 MB

Max Context FP16 0.0 MB

Max Context INT8 0.0 MB

Hidden Size3,072

Vocabulary Size131,072

Model Dtypebfloat16

Layer Types:

Attention

MLP/FFN

Normalization

Embedding