🐬 ByteDance дропнули самую точную OCR-модель для распознавания любых PDF — Dolphin превращает в офор
🐬 ByteDance дропнули самую точную OCR-модель для распознавания любых PDF — Dolphin превращает в оформленный текст фотки документов, сканы отчётов и даже научные статьи.
Нейронка сохраняет форматирование и вытаскивает содержимое — абзацы, таблицы, диаграммы, рисунки и формулы. Можно точечно парсить даже отдельные элементы (например, таблицы).
GitHub лежит тут, демка — тут.
@GPTMainNews