el M5 Max es un juguete de 3.500 dólares el único número que importa para la IA local: tokens/seg Lo que realmente importa para la inferencia en un LLM (en orden): El ancho de banda de memoria → determina el tok/s VRAM/memoria unificada → determina el tamaño del modelo Cálculo → apenas importa para inferencia 25 fichas/segundo en 70B suena impresionante hasta que te das cuenta de que la IA agente necesita 100+ para no sentirse rota El M5 es un gran portátil, pero no es material para servidores