Img2prompt - это инструмент для генерации текстовых подсказок на основе изображений. Он использует нейронную сеть, которая анализирует содержание изображения и создает короткий абзац текста, описывающий его. Этот текст может быть использован для различных целей, таких как поиск по изображению, креативное письмо или обучение моделей генерации текста.
Methexis-Inc / img2prompt - это инструмент, предназначенный для генерации приблизительных текстовых подсказок, соответствующих изображению. Этот инструмент особенно оптимизирован для стабильного распространения (клип ViT-L / 14).
Инструмент основан на блокноте CLIP Inquirator с открытым исходным кодом, созданном @pharmapsychotic, и использует модели клипов OpenAI для подбора изображений для различных исполнителей, сред и стилей.
Затем результаты сравнения объединяются с краткими подписями для создания текстовой подсказки, которую можно использовать для создания дополнительных изображений, похожих на оригинал.
Инструмент можно запустить через API или получить доступ к репозиторию и лицензии GitHub для получения дополнительной информации. Прогнозы обычно выполняются в течение 24 секунд и выполняются на оборудовании с графическим процессором Nvidia T4.