Baidu выпустили в открытый доступ модель ERNIE‑Image для генерации картинок. Это нейросеть на 8 миллиардов параметров: она уверенно понимает сложные запросы, умеет корректно рендерить текст и работает в разных стилях — от аниме до фотореализма. Запустить её можно на компьютере с 24 ГБ видеопамяти.
Кроме того, в систему добавили «усилитель подсказок» — отдельную модель на 3 миллиарда параметров, которая разворачивает короткие промты, дополняет их деталями и помогает получать результат лучше.
https://ernie.baidu.com/blog/posts/ernie-image/
Кроме того, в систему добавили «усилитель подсказок» — отдельную модель на 3 миллиарда параметров, которая разворачивает короткие промты, дополняет их деталями и помогает получать результат лучше.
https://ernie.baidu.com/blog/posts/ernie-image/
