Dots.Mocr — это инструмент для парсинга документов и структурированной графики, который умеет распознавать текст на разных языках, преобразовывать графику в SVG-код и работать с интерактивными запросами. Модель справляется с таблицами, формулами, многоколоночными текстами, старыми сканами, схемами интерфейсов, научными иллюстрациями и химическими формулами.
Dots.Mocr показывает результаты на уровне лидеров в задачах распознавания документов среди моделей сопоставимого размера. Параллельно с основной версией доступна модификация dots.mocr-svg, заточенная под преобразование изображений в SVG. При этом модель сохраняет производительность в общих визуальных задачах на уровне Qwen3-VL-4B.
Инструмент работает через GitHub, поддерживает установку через conda, интегрирован с vLLM для быстрого развертывания и инференса. В репозитории есть демо-скрипты для парсинга документов, веб-страниц и распознавания сцен, настройки промптов и параметров для улучшения качества вывода.