3 năm là một khoảng thời gian hào phóng. Các tác nhân đã hoạt động mà không cần bạn. Mỗi tác nhân luôn hoạt động đều tiêu tốn tài nguyên tính toán suốt cả ngày lẫn đêm. AWS không thể xây dựng các trung tâm dữ liệu đủ nhanh, và mọi công ty trên trái đất đều muốn thực hiện suy diễn 24/7. Hai năm trước, chỉ có GPT-4 và không có gì khác. Bây giờ có Claude, Gemini, Grok, Kimi k-2.5, DeepSeek, Mistral, MiniMax, GLM-5... và mỗi cái trong số đó đều cần GPU hoạt động suốt cả ngày lẫn đêm. Bạn không thể vận hành điều đó chỉ với ba trung tâm dữ liệu ở Virginia.