Trí tuệ nhân tạo (AI) đã được giao một nhiệm vụ mới đó là chiếm lĩnh thế giới nghệ thuật. Sau thành công vang dội của OpenAI’s Dall-E 2, đã có một loạt các chương trình AI bất ngờ tìm cách biến một người bình thường thành một Picasso thời hiện đại.
Mặc dù có rất nhiều công cụ, nhưng một trong những công cụ tốt nhất (và được cho là độc nhất) được gọi là Midjourney. Không giống như các đối thủ cạnh tranh nguyên sơ của nó như Dall-E hoặc Google’s Imagen, Midjourney muốn thêm một chút nghệ thuật vào yêu cầu của bạn.
Midjourney là gì và nó làm được gì?
Midjourney là một trong nhiều trình tạo hình ảnh AI đã xuất hiện gần đây. Không giống như Dall-E 2 hoặc một số đối thủ cạnh tranh khác, Midjourney mang đến phong cách nghệ thuật đẹp như mơ
Nó có thể sẽ thu hút những người làm việc trong lĩnh vực văn học đòi hỏi cảm giác gothic hơn. Trong khi các trình tạo AI khác nghiêng về ảnh nhiều hơn, thì Midjourney giống một công cụ vẽ.
Midjourney yêu cầu bạn nhập yêu cầu cho một hình ảnh, ví dụ: “Một con cáo đội mũ chóp theo phong cách minh họa của Roald Dahl” và trong vài giây, bạn sẽ được trả về nhiều kết quả về hình ảnh này.
Tuy nhiên nó có thể gặp khó khăn khi tạo ra bàn tay hoặc các đối tượng phức tạp khác và nền thường có thể bị mờ hoặc nhầm lẫn, nhưng đây là những vấn đề sẽ gặp phải với bất kỳ trình tạo hình ảnh khác.
Làm cách nào có thể đăng ký sử dụng Midjourney?
Midjourney hoạt động hơi khác so với hầu hết các công cụ AI. Mặc dù có thể đăng ký trực tiếp thông qua trang web của công ty, nhưng việc sử dụng phần mềm này sẽ yêu cầu tải xuống và sử dụng Discord – một ứng dụng kiểu diễn đàn trò chuyện.
Khi đã được chấp nhận tham gia Midjourney’s Beta, bạn sẽ được gửi lời mời tham gia Midjourney Discord.
Bạn nhận được 25 truy vấn miễn phí, nếu muốn tiếp tục sử dụng phần mềm thi phải cần đăng ký tư cách thành viên trả phí (chi phí từ 8 – 60 USD/tháng tùy thuộc vào gói).
Khi đang ở trong Discord, chỉ cần đi tới bất kỳ kênh “newbie” nào được liệt kê ở phía bên trái. Sau đó, nhập “/imagine” theo sau là mong muốn của bạn. Bot sẽ phản hồi với bốn phiên bản của yêu cầu này trong vòng một phút.
Có thể chọn các phiên bản thay thế của bất kỳ hình ảnh nào trong số này hoặc nâng cấp một trong số chúng thành hình ảnh lớn hơn, chất lượng cao hơn.
Midjourney hoạt động như thế nào?
Đối với hầu hết các trình tạo hình ảnh AI, những người sáng tạo ra nó đã cung cấp hàng loạt thông tin về cách chúng hoạt động, cùng với việc xuất bản mã nguồn – đây không phải là trường hợp của Midjourney. Nhóm đằng sau nó đã giữ im lặng về nền tảng và quá trình đào tạo của nó.
Tuy nhiên, rất có thể Midjourney sử dụng một hệ thống tương tự cho cả Dall-E 2 và Stable Diffusion, đặc biệt là khi cả hai công ty đã giải thích chi tiết về phương pháp đào tạo của họ.
Những mô hình này đã được dạy về mối quan hệ được chia sẻ giữa một hình ảnh và văn bản được sử dụng để mô tả. Trước đây, Midjourney đã tuyên bố rằng, giống như các đối thủ cạnh tranh của mình, họ đã tìm kiếm trên internet các hình ảnh và văn bản để mô tả, sử dụng hàng triệu hình ảnh đã xuất ra để đào tạo.
Phần lớn các trình tạo hình ảnh AI có mã nguồn công khai tạo ra những hình ảnh này thông qua một quá trình được gọi là khuếch tán. Về cơ bản, các mô hình này hoạt động bằng cách thêm nhiễu vào hình ảnh, giảm nó thành một mớ hỗn độn pixel.
Sau đó, nó học cách khôi phục dữ liệu này bằng cách đảo ngược quá trình nhiễu. Quá trình này được lặp đi lặp lại nhiều lần, đào tạo mô hình để thêm tiếng ồn và sau đó loại bỏ nó một lần nữa. Sau đó, mô hình có thể áp dụng quy trình khử nhiễu để tạo ra hình ảnh chân thực bằng cách thực hiện các biến thể nhỏ cho hình ảnh.
Điều này được kết hợp với sự hiểu biết của mô hình về mối quan hệ giữa hình ảnh và văn bản được sử dụng để mô tả, giúp trình tạo hình ảnh AI hiểu những gì bạn đang yêu cầu.
Theo: https://www.sciencefocus.com/future-technology/midjourney/