Model Architecture: allenai/Olmo-3-1125-32B

📊 Model Parameters

Total Parameters 32,233,522,176

Context Length 65,536

Hidden Size 5120

Layers 64

Attention Heads 40

KV Heads 8

FP32 (Full) 120.08 GB

FP16 (Half) 60.04 GB

INT8 (Quantized) 30.02 GB

INT4 (Quantized) 15.01 GB

Per Token (FP16) 262.14 KB

Max Context FP32 32.00 GB

Max Context FP16 16.00 GB

Max Context INT8 8.00 GB

Vocabulary Size100,278

Hidden Size5,120

FFN Intermediate Size27,648

Number of Layers64

Attention Heads40

KV Heads8

Max Context Length65,536

Sliding Window Size4,096

Layer Attention Types[64 items]

Attention BiasNo

Attention Dropout0%

Tied EmbeddingsNo

Activation Functionsilu

RMSNorm Epsilon1e-06

Pad Token ID100,277

BOS Token IDNot set

EOS Token ID100257

Model Dtypebfloat16

Layer Types:

Attention

MLP/FFN

Normalization

Embedding