Model Architecture: google/gemma-3-12b-pt

📊 Model Parameters

Total Parameters 13,194,203,760

Context Length 2,048

Hidden Size 0

Layers 0

Attention Heads 0

KV Heads 0

FP32 (Full) 49.15 GB

FP16 (Half) 24.58 GB

INT8 (Quantized) 12.29 GB

INT4 (Quantized) 6.14 GB

Per Token (FP16) 0 B

Max Context FP32 0.0 MB

Max Context FP16 0.0 MB

Max Context INT8 0.0 MB

Tied EmbeddingsYes

Model Dtypebfloat16

Layer Types:

Attention

MLP/FFN

Normalization

Embedding