de M5 Max is een speelgoed van $3.500 de enige nummer dat ertoe doet voor lokale AI: tokens/sec wat er echt toe doet voor LLM-inferentie (in volgorde): geheugenbandbreedte → bepaalt tok/s VRAM/unified geheugen → bepaalt modelgrootte rekenkracht → doet er nauwelijks toe voor inferentie 25 tokens/sec op 70B klinkt indrukwekkend totdat je je realiseert dat agentic AI 100+ nodig heeft om niet gebroken te voelen M5 is een geweldige laptop, maar niet geschikt voor servers