Ilmuwan sosial yang bekerja dengan bahan yang membutuhkan digitalisasi hanya dapat mempelajari apa yang dapat dibaca mesin. Dalam praktiknya, itu berarti dokumen aksara Latin yang dicetak dari arsip yang didanai dengan baik. Dalam kertas kerja baru, saya menunjukkan bahwa Model Bahasa Visi yang menggunakan zero-shot mengungguli setiap sistem OCR yang ada di setiap skrip yang dievaluasi, dan saya mengusulkan pipeline untuk menerapkannya pada koleksi baru. Saya menerapkannya ke enam koleksi arsip yang mencakup 1,8 juta halaman di enam negara dengan harga di bawah $1,900.