Nvidia đã trả 3 lần định giá của Groq vào tháng 9 để mua lại công ty này. Điều này mang tính chiến lược hạt nhân. Mỗi phòng thí nghiệm AI đều phụ thuộc vào GPU, tạo ra rủi ro tập trung lớn. Google đã thoát khỏi điều này với TPUs cho việc sử dụng nội bộ, chứng minh rằng câu chuyện "Nvidia hoặc không có gì" là sai. Điều này không chỉ chứng minh tính khả thi về mặt kỹ thuật, mà còn tiết lộ rằng hàng rào bảo vệ của Nvidia nông hơn những gì thị trường tin tưởng. Khi một hyperscaler thành công trong việc xây dựng silicon tùy chỉnh, mọi người mua tinh vi bắt đầu tính toán "chúng ta có nên tự xây dựng không?". Điều này làm giảm quy mô thị trường khả thi (TAM) của Nvidia. Jonathan Ross (người sáng lập Groq) là người phát minh ra TPU. Ông hiểu các nguyên tắc kiến trúc đã làm cho việc tăng tốc AI không dựa vào GPU trở nên khả thi. Kiến trúc LPU của ông nhắm đến khối lượng công việc suy diễn, nơi mà GPU thực sự được thiết kế quá mức. Điều này quan trọng vì suy diễn là nơi có tiền thực sự trong dài hạn. Đào tạo là chi phí vốn một lần, nhưng suy diễn là chi phí hoạt động định kỳ mà tăng theo mức sử dụng. Nếu Groq chứng minh rằng LPUs có thể đạt được hiệu suất giá cả cạnh tranh trong suy diễn, mọi nhà cung cấp đám mây sẽ gán nhãn trắng cho kiến trúc của họ. Nvidia sẽ bị ép vào "chỉ đào tạo" trong khi mất đi dòng thu nhập định kỳ. Có thể coi thỏa thuận này là Nvidia đang bảo hiểm chống lại việc Groq cho phép một hệ sinh thái hoàn toàn các lựa chọn thay thế cho Nvidia. Nhưng điều thú vị hơn là hiệu ứng bậc hai, sự khóa chặt khách hàng. Bây giờ, Nvidia sở hữu cả tiêu chuẩn hiện tại (CUDA + GPU) và kiến trúc thay thế đáng tin cậy nhất (LPUs). Điều này giống như MSFT mua Github ở cấp độ chiến lược. Bất kỳ phòng thí nghiệm AI nào đang đánh giá "xây dựng so với mua so với nhà cung cấp thay thế" giờ đây phải đối mặt với: - Lựa chọn A (Nvidia GPUs) - Lựa chọn B (Nvidia <> Groq LPUs) - Lựa chọn C (bắt đầu từ đầu) Biến mối đe dọa cạnh tranh thành công cụ phân khúc khách hàng, Jensen là bậc thầy của các giao dịch. Họ giờ đây có thể phân biệt giá: khách hàng cao cấp trả tiền cho GPUs, suy diễn nhạy cảm về giá được chuyển đến LPUs, và Nvidia thu được cả hai. Nếu Nvidia không tích hợp LPUs vào lộ trình của mình, đây chỉ là một động thái phòng thủ thuần túy. Nếu họ tích hợp nó và bắt đầu cung cấp các gói "GPU cho đào tạo, LPU cho suy diễn", điều này trở thành một vụ mua lại mở rộng hàng rào bảo vệ theo sách giáo khoa. Điều đắt giá nhất trong công nghệ không phải là xây dựng tương lai, mà là ngăn chặn người khác xây dựng một tương lai mà không có bạn.