So sánh mức độ chính xác của DALL-E 3 và MidJourney (MJ)

Tuy mới ra mắt nhưng DALL-E 3 của OpenAi đã tạo được tiếng vang khi nhưng cập nhật, thay đổi mới nhất đã đem lại những cải thiện mang tính đột phá trong quá trình tạo ảnh nghệ thuật.
Trong thời gian sắp tới, Kaikun cũng sẽ tích hợp DALL-E 3 vào trong sản phẩm của mình, do đó chúng tôi đã thử làm so sánh kết quả tạo ra từ DALL-E 3 với một AI tạo ảnh hết sức nổi tiếng khác MidJourney.
Chúng tôi sẽ thử so sánh ảnh tạo ra từ 2 AI này với cùng một prompt, AI nào có ảnh tạo ra sát với mô tả nhất sẽ chiến thắng.
(Lưu ý: prompt bằng tiếng anh và được dịch tiếng việt cho mọi người dễ hình dung. Bên dưới là ảnh tạo từ MJ, bên trên là ảnh tạo từ DALL-E 3)

Prompt 1: Universe Heart
“An illustration of a human heart made of translucent glass, standing on a pedestal amidst a stormy sea. Rays of sunlight pierce the clouds, illuminating the heart, revealing a tiny universe within. The quote ‘Find the universe within you’ is etched in bold letters across the horizon.”
["Một minh họa về trái tim con người được làm từ thủy tinh trong suốt, đứng trên một bệ giữa biển cả đầy bão tố. Những tia nắng mặt trời xuyên qua những đám mây, chiếu sáng trái tim, tiết lộ một vũ trụ nhỏ bên trong. Câu trích dẫn ‘Tìm kiếm vũ trụ bên trong bạn’ được khắc bằng chữ in đậm trên chân trời]


Rõ ràng tạo ra chũ không phải thế mạnh của MJ, trong khi DALL đã quá ấn tượng khi tạo ra dòng chữ và ảnh rất sát prompt. ( +1 DALL)

Prompt 2: Sunset View

Prompt: “A modern architectural building with large glass windows, situated on a cliff overlooking a serene ocean at sunset.”
Một tòa nhà kiến trúc hiện đại với những cửa sổ kính lớn, nằm trên một vách đá nhìn ra biển yên bình vào lúc hoàng hôn


Kiến trúc của hai tòa nhà rất ổn, tuy nhiên màu sắc của DALL như lúc bình minh chứ không phải hoàng hôn ( +1 MJ)

Prompt 3: My life is a potato
“Tiny potato kings wearing majestic crowns, sitting on thrones, overseeing their vast potato kingdom filled with potato subjects and potato castles.”
“Những vị vua khoai tây nhỏ bé đội vương miện tráng lệ, ngồi trên ngai vàng, quản lý vương quốc khoai tây rộng lớn của họ, đầy dẫy những chủ đề về khoai tây và những lâu đài khoai tây.”



Mặc dù DALL tạo ra củ giống khoai tây hơn, nhưng MJ lại tạo được tỉ lệ các ông vua khoai tây nhiều hơn, có cả ngai vàng, do đó vòng này hòa.

Round 4: The porcelain lady

Prompt: “A middle-aged woman of Asian descent, her dark hair streaked with silver, appears fractured and splintered, intricately embedded within a sea of broken porcelain. The porcelain glistens with splatter paint patterns in a harmonious blend of glossy and matte blues, greens, oranges, and reds, capturing her dance in a surreal juxtaposition of movement and stillness. Her skin tone, a light hue like the porcelain, adds an almost mystical quality to her form.”
“Một phụ nữ châu Á ở tuổi trung niên, mái tóc đen của cô có những sợi bạc, trông như bị vỡ vụn và nứt nẻ, được gắn kết một cách tinh vi trong một biển đồ sứ vỡ. Đồ sứ lấp lánh với những họa tiết sơn phun trong một sự kết hợp hài hòa của màu xanh dương, xanh lá, cam và đỏ, ghi lại điệu nhảy của cô trong một sự đối lập huyền ảo giữa sự chuyển động và tĩnh lặng. Màu da của cô, một sắc thái nhẹ như đồ sứ, thêm vào hình dáng của cô một chất lượng huyền bí.”

Hình MJ tạo ra quá đẹp, nhưng lại không hề đúng nội dung, +1 DALL

Round 5: The Band
Prompt: “A 2D animation of a folk music band composed of anthropomorphic autumn leaves, each playing traditional bluegrass instruments, amidst a rustic forest setting dappled with the soft light of a harvest moon.
Một hoạt hình 2D về một ban nhạc dân gian được tạo thành từ những chiếc lá thu nhân cách hóa, mỗi chiếc lá đều chơi các nhạc cụ bluegrass truyền thống, giữa một cảnh rừng nông thôn cổ kính, ánh sáng mềm mại của trăng thu làm tán loáng khắp nơi



Một lần nữa MJ cho thấy cái style tạo ra rất tuyệt vời nhưng độ chính xác của prompt là không cao. +1 DALL

Round 6: The spiky chair

Prompt: “Photo of a lychee-inspired spherical chair, with a bumpy white exterior and plush interior, set against a tropical wallpaper.”
Ảnh của một chiếc ghế hình cầu lấy cảm hứng từ trái vải, với bề ngoài trắng có gai và bên trong êm ái, được đặt trước nền giấy dán tường mang họa tiết nhiệt đới.



Tôi có vẻ thấy cả 2 con đều có những ưu điểm, trong khi DALL giữ vững được màu sắc thì MJ làm cho tôi cảm thấy có tính chất nhiệt đới trong bức ảnh nhiều hơn . Kết quả hòa.

Round 7: Dancer’s desire

Prompt: “In front of a deep black backdrop, a figure of middle years, her Tongan skin rich and glowing, is captured mid-twirl, her curly hair flowing like a storm behind her. Her attire resembles a whirlwind of marble and porcelain fragments. Illuminated by the gleam of scattered porcelain shards, creating a dreamlike atmosphere, the dancer manages to appear fragmented, yet maintains a harmonious and fluid form.”
Trước phông nền màu đen sâu thẳm, một hình ảnh về người phụ nữ trung niên, làn da Tongan của cô đầy sức sống và rạng rỡ, được chụp giữa lúc cô đang xoay mình, mái tóc xoăn của cô trôi dạt như một cơn bão phía sau. Trang phục của cô giống như một cơn lốc của các mảnh đá cẩm thạch và sứ. Được chiếu sáng bởi ánh sáng lấp lánh từ những mảnh sứ vụn, tạo ra một không khí mơ màng, vũ công vẫn giữ được hình dạng vỡ vụn, nhưng vẫn duy trì được hình thức hài hòa và linh hoạt.


Thực sự ảnh DALL tạo ra tôi không còn nhìn ra hình dạng chiếc váy, vì vậy round này +1 MJ

Tổng kết: Qua 7 vòng đấu, mặc dù chất ảnh MJ ra luôn có sức mạnh nghệ thuật, rất giàu chi tiết nhưng về mức độ chính xác trong mô tả, tôi tuyên bố chiến thắng tạm thời nghiên về DALL-E 3 với tỉ sổ 3-2.

Bài viết có sự tham khảo của Eray Eliaçık

3 Lượt thích