Model Architecture: google/gemma-3-4b-pt

📊 Model Parameters

Total Parameters 4,971,331,952

Context Length 2,048

Hidden Size 0

Layers 0

Attention Heads 0

KV Heads 0

FP32 (Full) 18.52 GB

FP16 (Half) 9.26 GB

INT8 (Quantized) 4.63 GB

INT4 (Quantized) 2.31 GB

Per Token (FP16) 0 B

Max Context FP32 0.0 MB

Max Context FP16 0.0 MB

Max Context INT8 0.0 MB

Tied EmbeddingsYes

Model Dtypebfloat16

Layer Types:

Attention

MLP/FFN

Normalization

Embedding