SDXL Turbo là gì? Vì sao nó lại nhanh như vậy?

Ngay sau khi giới thiệu Stable Video Diffusion với khả năng tạo video động từ ảnh tĩnh, Stability AI đã tung ra phiên bản model SDXL mới nhất có tên sdxl-turbo. Đây là model được đào tạo với phương pháp mới có tên gọi Adversarial Diffusion Distillation (ADD) (xem thêm báo cáo tại đây).
Phương pháp này cho phép lấy mẫu các mô hình khuếch tán hình ảnh cơ bản quy mô lớn trong 1 đến 4 bước với chất lượng hình ảnh cao (trước đây mô hình SDXL cần tối thiểu 50 bước).
Turbo không sử dụng guidance_scale or negative_prompt, các nhà phát triển đã vô hiệu hóa nó bằng guidance_scale=0.0 . Tốt hơn là mô hình tạo ra hình ảnh có kích thước 512x512 nhưng kích thước hình ảnh cao hơn cũng hoạt động tốt.

Dưới dây là so sánh hiệu quả khi sử dụng model SDXL Turbo và các model khác.


Dễ nhận ra là chỉ với 1 bước SDXL tạo ra ảnh rất tốt so với các model khác với các thông số tương tự, tuy nhiên model tốt nhất với step = 4 và tốc độ được cải thiện do số step giảm đi đáng kể.


Model base 50 steps, thời gian 11.6s


Model Tubro, 4 steps, thời gian 1.4s

Hướng dẫn sử dụng model SDXL - Turbo trên Kaikun AI

Model SDXL Turbo được tải sẵn trên Kaikun AI. Để sử dụng bạn chỉ cần chọn model này.
Các thông số quan trọng

Type Prompt
Steps: 4
Sampler: 4
CFG scale:1
Ấn Generate

Nếu không sử dụng Stable Diffusion, các bạn có thể thử trước tại đây
Chúc các bạn thành công!

1 Like