Buzz — это десктопное приложение для транскрибации и перевода аудио прямо на твоем компьютере, без отправки данных в облако. Работает на базе Whisper от OpenAI, но все вычисления происходят локально — твои записи остаются только у тебя.
Программа умеет расшифровывать аудио и видео файлы, ссылки с YouTube, а также записывать речь в реальном времени через микрофон. Есть режим презентации для мероприятий, когда транскрипцию нужно показывать на экране. Если запись шумная, Buzz может отделить речь от фона перед обработкой, чтобы результат получился точнее. Поддерживается идентификация спикеров — программа определяет, кто именно говорит в записи.
Buzz работает с несколькими бэкендами Whisper и умеет использовать видеокарты для ускорения: CUDA для Nvidia, встроенную поддержку для Apple Silicon на маках, Vulkan для большинства GPU, включая интегрированные. Готовые транскрипции можно экспортировать в TXT, SRT и VTT. Встроенный плеер позволяет искать по тексту, управлять воспроизведением и менять скорость. Для автоматизации есть режим отслеживания папки — новые файлы транскрибируются сами, плюс доступен интерфейс командной строки.
Приложение доступно для macOS, Windows и Linux в виде Flatpak или Snap. Можно установить через PyPI, если нужна гибкость настройки окружения. Проект открытый, активно развивается и не требует подписки или регистрации.