From Zero to Hero (P3): Img2Img - Khi AI đọc được hình ảnh của bạn

Như mình đã đề cập ở phần 2, khi bạn mô tả ở prompt của mình, sẽ có 1 số phần nếu AI sẽ không hiểu được vì nó đã không được “học” trước đó.

Để khắc phục được vấn đề này thì img2img sẽ đưa thêm 1 data đầu vào cho AI, làm cho AI hiểu hơn về bức ảnh của bạn và tạo ra bức ảnh đó tốt hơn.
Chúng ta hãy thử nghiệm các chức năng của img2img bằng tấm ảnh của teoatienza

Bức ảnh này có kích thước 960 x 1664, các bạn hãy nhớ kích thước này nhé!
:one: I. Read Image
Tác dụng chính của việc này là AI có thể dùng dữ liệu đã học để mô tả những gì có trong hình ảnh để bạn prompt lại

Load hình ảnh trên vào img2img, và ấn Interrogate CLIP/DeepBooru ta sẽ có 2 kết quả:

CLIP: a man with a beard and a beard standing in the water with a spear in his hand and a large head, fantasy art, poster art, epic fantasy character art, Bastien L. Deharme

DEEPBOORU: air bubble, antlers, aurora, bubble, city lights, constellation, earth (planet), galaxy, giant, glowing, light particles, male focus, milky way, night, night sky, planet, sharp teeth, shooting star, sky, snow, snowing, solo, space, star (sky), starry background, starry sky, teeth, underwater

Ở đây do 2 data khác nhau nên ta có 2 cách phân tích khác nhau, nhưng dù cách nào thì chúng ta có thể thấy prompt đang cố gắng mô tả lại các chi tiết trong ảnh.
Sau khi có prompt, ta có thể tái tạo ảnh theo phong cách của chúng ta

:two: Replica

Các thông số cần giải thích trước khi bắt đầu:
Resize Mode:
Hãy tưởng tượng tình huống sau: bạn có một hình ảnh có kích thước 512x500 và bạn muốn tạo ra một hình ảnh có kích thước 1024x1024. Tuy nhiên, tỉ lệ khung hình không giống nhau. Bạn nên làm gì trong trường hợp này?

Just resize: Đây giống như việc co dãn hình ảnh để có kích thước 1024x1024. Bỏ qua tỉ lệ khung hình và chỉ căng ra hình ảnh.

Crop and resize: Điều này sẽ cắt hình ảnh của bạn thành kích thước 500x500, sau đó thay đổi kích thước thành 1024x1024. Tỉ lệ khung hình được giữ nguyên nhưng một ít dữ liệu ở phần trái và phải sẽ bị mất.

Resize and fill: Điều này sẽ thêm nhiễu (noises) mới vào hình ảnh của bạn để làm đầy nó thành kích thước 512x512, sau đó thay đổi kích thước thành 1024x1024, với hi vọng rằng img2img sẽ biến nhiễu đó thành một cái gì đó hợp lý.

Just resize (latent upscale): Tương tự như phương pháp đầu tiên, nhưng sử dụng phương pháp upscale lantent.

Resize to: Tăng resolution theo kích thước nhất định
Resize by: Tăng kích thước theo tỉ lệ ( tối đa 4 lần trong 1 lần cài đặt)

TIP NHỎ: Nhấn vào hình bức tranh để resolution đạt đúng tỉ lệ của ảnh gốc
image

Denoising strength: càng nhỏ thì sự thay đổi càng ít, càng lớn thì thay đổi càng nhiều. Đây là thông số quan trọng nhất nhưng không có giá trị cố định. Bạn phải tự trải nghiệm để đưa ra thông số thích hợp trong từng trường hợp.

Mình muốn bức ảnh của mình có hơi hướng style anime thay vì style 3D như hiện tại, chúng ta sẽ chuẩn bị các bước như sau

Mình sẽ chọn prompt của CLIP bên trên (vì mình thấy phù hợp với mục đích của mình hơn)
Model: Toonyyou_beta6
Các thông số khác như hình:

Ok và ấn generate:

Tèn ten, quá hài lòng, bức ảnh giữ nguyên vẹn bố cục gốc và có nhiều hơn phong cách anime mà mình muốn.

Như đã nó ở trên, việc thay đổi denoising sẽ thay đổi rất nhiều bức ảnh của bạn, hãy xem ví dụ dưới đây

:boom: Ở denoising 0,6 và 1 ngoài việc bức ảnh không bám sát ảnh gốc, các bạn còn thấy 1 tình trạng ở người mới phổ biến gặp, đó là có tận 2 khuôn mặt. Tình trạng biến dị này chính là do kích cỡ không phù hợp (mình đã bảo các bạn lưu ý kích cỡ ngay từ đầu). Để cải thiện tình trạng này, hãy luôn ưu tiên ảnh của các bạn trong các kích cỡ sau đây: 512 x 512 ; 768 x 768; 512 x 768 . Đọc thêm các cách khắc phục xem thêm From Zero to Hero (P4): Sửa những khuyết điểm thường gặp khi tạo ảnh từ Stable Diffusion.

:three: Upscale

Để bức ảnh có độ nét và nhiều chi tiết hơn, chắc chắn các bạn phải tăng độ phân giải ( upscale).
Một phương pháp nâng cao để tăng cường chất lượng ảnh hãy xem tại Upscale lên 4K ảnh của Dall-E bằng SD.

Ở đây mình chỉ đơn giản tăng resize by, các bạn thấy kích thước sẽ tăng gấp đôi.
image
Lưu ý việc tăng độ phân giải sẽ mất kha khá thời gian của bạn.

Đây là so sánh trước và sau khi tăng cường độ phân giải, kích thước bức ảnh tăng lên đáng kể

Chúc mọi người thực hành thành công!

1 Lượt thích