From Zero To Hero (P24): Workflow Ultimate Upscale + Zoom vô cực

Một trong những phương pháp Upscale phổ biến và có tính ứng dụng cao là kết hợp Controlnet Tile và Ultimate Upscale
Để xem thêm về cách cài đặt, hãy đọc lại From Zero to Hero (P6): Nâng cấp chi tiết bức ảnh của bạn bằng các phương pháp Upscale .

Trong bài viết này mình ứng dụng phương pháp này để tăng độ chi tiết đến “vô hạn” cho bức ảnh, trong bài dự thi GIGABYTE AI GAMING: NGHỆ THUẬT TỪ TƯƠNG LAI 2024!
Đầu tiên là quá trình lên ý tưởng, ngay từ khi còn bé, khi nhìn thấy mainboard máy tính là mình luôn tưởng tượng ra một thành phố tương lai với đầy đủ hiện tại, tiện nghi, do đó tưởng của mình là lấy mainboard Gigabyte như quảng trường trung tâm thành phố hiện đại này, xung quanh các tụ và các jack cắm như những tòa nhà.

Về phần ý tưởng, mình thấy DallE 3 làm việc khá tốt, vì vậy mình sử dụng Dall-E 3 để lên mường tượng các ý tưởng
Vào Ai image, chọn Generate, chọn Dall-E 3, gõ prompt là lựa chọn hinh ảnh mô tả tương đối tưởng tượng của bạn.

Sau đó, mình cần các chi tiết sáng tạo hơn, phần này Mid Journey làm rất tốt, vì vậy mình sẽ sử dụng Mid Journey. Mình chuyển qua tab MJ, và kéo bức ảnh đã ưng vừa tạo trên Dall-E 3, vào phần image trên MJ. Ở đây có 3 lựa chọn là image blend, style reference và character reference. Do mình muốn phong cách vẫn giữ được nội dung mình mong muốn nên sẽ chọn Style Reference

Các kết quả tạo ra được hiển thị ở bên phải

Sau khi đã lựa chọn được ảnh ưng ý, giờ đến "cơ bắp " của Stable Diffusion trổ tài. Mở Stable Diffusion nâng cao lên, mình chuyển tab img2img, thả ảnh mẫu vào và gõ prompt.
Các setting các bạn có thể kham khảo như bên dưới

Ở kích thước ảnh, từ kích thước mặc định 1024 x 1024, giờ mình sẽ nâng lên gấp đôi.
Ảnh tạo ra tiếp tục bỏ lại input, và quá trình cứ tiếp tục và tiếp tục, lặp đi lặp lại.
Kết quả cuối cùng 12000x12000 được tạo ra từ bức ảnh 6000x 6000 tốn khoảng 1h30p của mình (RTX 4090 trên Kaikun), các bạn có thể nhìn thấy con số estimate ở bên phải.

Cuối cùng công đoạn nhọc nhằn nhất là sửa lại các lỗi, ở đây mình dùng generative fill của Photoshop, soi các lỗi nhỏ

Trên nóc một tòa nhà có có logo Gigabyte phát sát dễ quan sát ở ảnh thường, nhưng ở trái tim của thành phố, trung tâm của quảng trường, phải zoom sát lại các bạn mới có thể thấy logo AORUS.

Các bạn có thể xem kết quả cuối cùng ở đây.

Các làm này rất hay và phù hợp với ảnh có các bạn muốn tăng độ chi tiết. Một mẹo nhỏ là các bạn có thêm thêm lora “add details” để tăng thêm độ chi tiết. Về lý thuyết, việc tăng kích thước ảnh là vô hạn, còn thực tế nó phụ thuộc nhiều vào máy tính cấu hình của bạn. Với mình 4K và 8K là kích thước hoàn toàn khả thi. Còn việc tăng kích thước rất lớn sẽ có rất nhiều khuyết điểm trong ảnh, đặc biệt là AI tại thời điểm hiện tại không thể tạo quá nhiều người một lúc, luôn luôn có sự sai lệch nếu tạo quá nhiều người.

Chúc mọi người thành công!