Diffusers Kandinsky генерирует нерелевантные изображения

Question

Разрабатываю программу, в которой необходимо генерировать изображения по сгенерированным промптам. Желательный язык - русский, поэтому решил начать тестирование рукотворным промптом с Kandinsky. По моему промпту локальный Kandinsky генерирует нерелевантное изображение.

import torch
from diffusers import Kandinsky3Pipeline
pipe = Kandinsky3Pipeline.from_pretrained("kandinsky-community/kandinsky-3", variant="fp16", torch_dtype=torch.float16)
pipe.enable_sequential_cpu_offload()
prompt = "Кладбище ржавых автомобилей в Зоне, десятки заброшенных машин, вид сверху, мрачная атмосфера"
image = pipe(prompt, guidance_scale=8, num_inference_steps=50).images[0]
image.show()

Первое изображение получено запуском кода, второе из бота Kandinsky версии 3.1 в телеграмме. Можно как-то сделать чтобы локальный Kandinsky выдавал подобное ботом изображение?

Answer 1

Создатель ответил, что open-source Kandisnky 3 плохо поддерживает генерацию на русском, необходимо использовать английский.

БЛОГ НА HUSL

Diffusers Kandinsky генерирует нерелевантные изображения

Ответы (1 шт):