Chúa ơi… Danh tính ẩn danh của bạn trên internet giờ đây có thể bị lộ ra với giá 1 đô la 😳 Không phải bởi FBI. Mà bởi bất kỳ ai có quyền truy cập vào Claude hoặc ChatGPT và một vài bình luận của bạn trên Reddit. ETH Zurich và Anthropic vừa phát hành một tài liệu có tên "Đánh dấu danh tính trực tuyến quy mô lớn với LLMs" và kết quả là nghiên cứu về quyền riêng tư đáng báo động nhất mà tôi đã đọc trong năm nay. Họ đã xây dựng một quy trình tự động hóa lấy các bài đăng ẩn danh của bạn, trích xuất tín hiệu danh tính, tìm kiếm trên web và xác định bạn là ai. Không cần điều tra viên con người. Hoàn toàn tự động. Hoạt động trên Hacker News, Reddit, LinkedIn, thậm chí cả các bản sao phỏng vấn đã được chỉnh sửa. Dưới đây là những con số đáng sợ. Trên Hacker News, 67% người dùng được xác định đúng. Khi hệ thống đưa ra một dự đoán, nó đúng 90% thời gian. Trên Reddit, các học giả đăng bài dưới bút danh: 52%. Trên các nhà khoa học có bản sao phỏng vấn đã được chỉnh sửa rõ ràng vì lý do riêng tư: 9 trong số 33 vẫn bị lộ danh tính. Quy trình hoạt động theo bốn bước mà họ gọi là ESRC. Trích xuất tín hiệu danh tính từ các bài đăng của bạn bằng cách sử dụng LLMs. Tìm kiếm các ứng viên phù hợp bằng cách sử dụng nhúng trên hàng ngàn hồ sơ. Lý luận về các ứng viên hàng đầu với các mô hình như GPT-5.2. Hiệu chỉnh độ tin cậy để khi nó đoán, gần như không bao giờ sai. Phương pháp đánh dấu danh tính cổ điển từ cuộc tấn công nổi tiếng của Giải thưởng Netflix? Gần như 0% hồi tưởng trên mọi bài kiểm tra. LLMs không chỉ cải thiện các kỹ thuật cũ. Họ đã làm cho các kỹ thuật cũ trông như đồ chơi. Khi họ mở rộng đến các hồ sơ Reddit tạm thời, khớp các bài đăng cũ của người dùng với các bài mới hơn trong khoảng thời gian một năm, quy trình đạt 67% hồi tưởng với 90% độ chính xác và 38% hồi tưởng với 99% độ chính xác....