Để có cái nhìn khách quan về phiên bản stable diffusion mới, liệu trả tiền có giúp cho ảnh có chất lượng tốt hơn, mình đã thử so sánh side by side 2 phiên bản mới nhất của Stable Diffusion và Mid Journey.
Trước khi xem thì cần có 1 số lưu ý:
- Ảnh được tạo ra với prompt giống nhau, thông số đều ở trạng thái mặc định, khách quan nhất.
- Bên trái là ảnh từ MJ và bên phải là ảnh từ SD
- Các ảnh đều nguyên gốc, không chỉnh sửa, upscale
- Các chủ đề mình lấy để so sánh là: Người (Portrait), Đồ ăn uống (Food & Drink), Phong Cảnh (Landscape); Kiến trúc (Architecture), Phương tiện (Vehicle)
Ở tất cả các ví dụ, góc độ của Stable Diffusion thể hiện sự chân thật, trong khi ảnh từ Mid Journey luôn cho mình cảm giác nghệ thuật. Riêng về lĩnh vực kiến trúc, Stable Diffusion có vẻ hiểu sai từ khóa “three-level”. Tại lĩnh vực đồ ăn uống thì mình cũng nghiêng về chiếc pizza của Mid Journey hơn.
Nhưng khoan đã, có gì đó chưa công bằng, khi tất cả các prompt đang sử dụng đều là prompt của Mid Journey, do đó Mid Journey thể hiện nhỉnh hơn là Stable Diffusion. Vì thế, mình thử lại bài so sánh với các prompt phong cách quen thuộc của Stable Diffusion các phiên bản trước.
Một lần nữa, Stable Diffusion lại luôn luôn ra chất lượng ảnh của người thật, trong khi Mid Journey lại có sự pha trộn giữa người thật và ảnh hoạt hình. Kiến trúc vẫn là điểm yếu của Stable Diffusion khi các ô cửa kính không được sắp xếp thẳng hàng. Trong khi đó, ly cocktail ngoài bãi biển mình thích phong cách của Stable Diffusion hơn.
Vẫn biết điểm mạnh của Stable Diffusion không chỉ dừng lại ở prompt nhưng việc cải thiện chất lượng ảnh chỉ dùng prompt không cho thấy nỗ lực đáng kế để bắt kịp với xu thế. Nếu thế mạnh này kết hợp với những phần mở rộng hiện có thì thực sự Stable Diffusion sẽ cực kỳ bá đạo.
Còn quan điểm của mọi người thế nào? hãy để lại bình luận dưới bài viết nhé