Model Architecture: google-t5/t5-base

📊 Model Parameters

Total Parameters 272,252,160

Context Length 2,048

Hidden Size 768

Layers 12

Attention Heads 12

KV Heads 12

FP32 (Full) 1.01 GB

FP16 (Half) 519.3 MB

INT8 (Quantized) 259.6 MB

INT4 (Quantized) 129.8 MB

Per Token (FP16) 36.86 KB

Max Context FP32 144.0 MB

Max Context FP16 72.0 MB

Max Context INT8 36.0 MB

Vocabulary Size32,128

FFN Intermediate Size3,072

Number of Layers12

Attention Heads12

Max Context Length512

Tied EmbeddingsYes

RMSNorm Epsilon1e-06

Activation Functionrelu

Hidden Dropout10.0%

Pad Token ID0

EOS Token ID1

Model DtypeNot set

Layer Types:

Attention

MLP/FFN

Normalization

Embedding