Diffusers Kandinsky генерирует нерелевантные изображения
Разрабатываю программу, в которой необходимо генерировать изображения по сгенерированным промптам. Желательный язык - русский, поэтому решил начать тестирование рукотворным промптом с Kandinsky. По моему промпту локальный Kandinsky генерирует нерелевантное изображение.
import torch
from diffusers import Kandinsky3Pipeline
pipe = Kandinsky3Pipeline.from_pretrained("kandinsky-community/kandinsky-3", variant="fp16", torch_dtype=torch.float16)
pipe.enable_sequential_cpu_offload()
prompt = "Кладбище ржавых автомобилей в Зоне, десятки заброшенных машин, вид сверху, мрачная атмосфера"
image = pipe(prompt, guidance_scale=8, num_inference_steps=50).images[0]
image.show()
Первое изображение получено запуском кода, второе из бота Kandinsky версии 3.1 в телеграмме. Можно как-то сделать чтобы локальный Kandinsky выдавал подобное ботом изображение?
Ответы (1 шт):
Автор решения: Intolighter
→ Ссылка
Создатель ответил, что open-source Kandisnky 3 плохо поддерживает генерацию на русском, необходимо использовать английский.

