Thú vị làm sao khi 99% người cố gắng giải thích về LLMs lại quên rằng chúng không tạo ra token tiếp theo, mà chúng tạo ra một phân phối xác suất trên toàn bộ không gian từ vựng mà ứng dụng cuối cùng có thể tự do lấy mẫu từ đó. Bạn thường không được trình bày với Token Có Xác Suất Cao Nhất.
Gergely Orosz
Gergely Orosz21:46 4 thg 9
Thú vị làm sao mà 99% người sử dụng LLM lại quên cách mà những thứ này hoạt động: Chúng là những cỗ máy xác suất tiên tiến. Chúng tạo ra token (từ) tiếp theo có khả năng xảy ra nhất dựa trên đầu vào và quá trình đào tạo của chúng. Ở bên trong, đó là một phép nhân ma trận khổng lồ cho ra kết quả một cách kỳ lạ.
848,1K