Model Architecture: zai-org/GLM-4.6V-Flash

📊 Model Parameters

Total Parameters 9,672,020,480

Context Length 2,048

Hidden Size 0

Layers 0

Attention Heads 0

KV Heads 0

FP32 (Full) 36.03 GB

FP16 (Half) 18.02 GB

INT8 (Quantized) 9.01 GB

INT4 (Quantized) 4.50 GB

Per Token (FP16) 0 B

Max Context FP32 0.0 MB

Max Context FP16 0.0 MB

Max Context INT8 0.0 MB

Tied EmbeddingsNo

Model DtypeNot set

Layer Types:

Attention

MLP/FFN

Normalization

Embedding