في غضون 48 ساعة فقط في عام @RunAnywhereAI بنينا MetalRT: متغلبين على @Apple في لعبتهم الخاصة وتقديم أسرع محرك استدلال لنماذج اللغة الكبيرة في السوق حاليا لسيليكون آبل. - فك تشفير 570 توك/ثانية @liquidai LFM 2.5-1.2B 4-بت - فك تشفير 658 توك/ث @Alibaba_Qwen Qwen3-0.6B، 4-بت - 6.6 مللي ثانية من الوقت للوصول إلى أول رمز - 1.19× أسرع من MLX الخاصة بآبل (ملفات نماذج متطابقة) - 1.67× أسرع من llama.cpp في المتوسط لقد سحقنا Apple MLX و llama.cpp وuzu (من TryMirai) وOllama عبر أربعة نماذج مختلفة من 4-بت، بما في ذلك LFM2.5-1.2B المحسنة على الجهاز على جهاز M4 Max واحد. متحمس لهذه اللعبة! #ycombinator #runanywhere #ondeviceai #applesilicon #mlx