Генерация текстовых подсказок на основе изображений.
Img2prompt - это инструмент для генерации текстовых подсказок на основе изображений. Он использует нейронную сеть, которая анализирует содержание изображения и создает короткий абзац текста, описывающий его. Этот текст может быть использован для различных целей, таких как поиск по изображению, креативное письмо или обучение моделей генерации текста.
Methexis-Inc / img2prompt - это инструмент, предназначенный для генерации приблизительных текстовых подсказок, соответствующих изображению. Этот инструмент особенно оптимизирован для стабильного распространения (клип ViT-L / 14).
Инструмент основан на блокноте CLIP Inquirator с открытым исходным кодом, созданном @pharmapsychotic, и использует модели клипов OpenAI для подбора изображений для различных исполнителей, сред и стилей.
Затем результаты сравнения объединяются с краткими подписями для создания текстовой подсказки, которую можно использовать для создания дополнительных изображений, похожих на оригинал.
Инструмент можно запустить через API или получить доступ к репозиторию и лицензии GitHub для получения дополнительной информации. Прогнозы обычно выполняются в течение 24 секунд и выполняются на оборудовании с графическим процессором Nvidia T4.
Нейросеть Img2prompt была впервые опубликована 07-03-2023 21:52:06 и вручную отредактирована 01-01-2024 22:42:21.