Hiểu rõ về cách Negative Prompt hoạt động trong việc tạo video

Negative prompt là cách bổ sung để điều chỉnh Stable Diffusion để đáp ứng yêu cầu của bạn. Không giống như việc inpainting yêu cầu vẽ mặt nạ, bạn có thể sử dụng negative prompt với tất cả sự thuận tiện của việc nhập liệu văn bản. Trên thực tế, một số hình ảnh chỉ có thể được tạo ra bằng cách sử dụng negative prompt đó là cách mà negative prompt hoạt động.

Trong bài viết này, chúng ta sẽ xem xét một ví dụ đơn giản về cách sử dụng negative prompt. Sau đó, tôi sẽ giải thích cách negative prompt hoạt động trong Stable Diffusion.

Đây là phần đầu tiên của loạt hai phần về negative prompt. Xem phần thứ hai: Cách sử dụng negative prompt để biết hướng dẫn xây dựng negative prompt tốt.

Một ví dụ đơn giản

Chỉ dùng positive prompt

Hãy thử tạo ra một số hình ảnh của người đàn ông. Đúng vậy, chúng ta đang tiến vào một lãnh vực chưa được khám phá ở đây… Tôi đang sử dụng Stable Diffusion v1.5 với prompt

Portrait photo of a man.

negative prompt hoạt động

Prompt: Portrait photo of a man.

OK, chúng ta đã có những gì chúng ta mong đợi. Không có điều gì đặc biệt. Mặc dù những người đàn ông này trông hơi nghiêm túc quá. Hãy thử loại bỏ ria mép của họ để làm cho họ trở nên nhẹ nhàng hơn. Hãy thử prompt

Portrait photo of a man without mustache.

negative prompt hoạt động

Prompt: Portrait photo of a man without mustache.

Chúng ta gặp vấn đề ở đây. Chúng ta còn thấy ria mép trở nên nổi bật hơn! Điều gì đang xảy ra? Nguyên nhân có thể là việc cross attention thất bại trong việc kết nối “không có” và “ria mép”. Stable Diffusion đã hiểu prompt như “người đàn ông” và “ria mép”. Đó là lý do tại sao bạn thấy cả hai trong hình.

Positive và negative prompts

Vậy chúng ta có thể làm gì để tạo ra hình ảnh người đàn ông không có ria mép? Điều này có phải là điều mà Stable Diffusion không thể thực hiện? Câu trả lời là sử dụng negative prompts. Nếu chúng ta sử dụng prompt

Portrait photo of a man.

cùng với negative prompt

mustache

Chúng ta cuối cùng có thể tạo ra một số hình ảnh người đàn ông không có ria mép! Bạn sẽ có kết quả tương tự khi sử dụng các mô hình v2.

negative prompt hoạt động

Prompt: Portrait photo of a man.
Negative prompt: mustache.

Ví dụ này thể hiện một nguyên tắc sử dụng negative prompt:

If you see something you don’t want, put it in negative prompt.

Xem thêm: Phân tích vai trò của negative prompts trong Stable Diffusion(Mở trong cửa số mới)

Làm thế nào negative prompt hoạt động?

Nhớ trong việc điều kiện hóa văn bản thành hình ảnh, prompt được chuyển thành các vector nhúng, sau đó được cung cấp cho dự đoán nhiễu U-Net. Thực tế, điều này chưa phải là toàn bộ câu chuyện. (Xin lỗi vì điều này đã xảy ra nhiều lần…) Thực tế có hai tập hợp của các vector nhúng, một cho positive prompt và một cho negative prompt.

Positive và negative prompts đứng chân một nhau. Cả hai đều có 77 ký tự. Bạn luôn có thể sử dụng một trong hai hoặc cả hai.

Negative prompt được thực hiện trong bộ chọn mẫu, thuật toán chịu trách nhiệm thực hiện quá trình giải phóng ngược. Để hiểu cách negative prompt hoạt động, trước tiên chúng ta cần hiểu cách mẫu mà không sử dụng negative prompt.

Mẫu mà không có negative prompt.

Trong bước mẫu trong Stable Diffusion, thuật toán trước tiên giảm nhiễu hình ảnh một chút thông qua mẫu có điều kiện, được hướng dẫn bởi lời nhắc văn bản. Sau đó, bộ mẫu tiếp tục giảm nhiễu hình ảnh cùng với mẫu không điều kiện. Điều này hoàn toàn không được hướng dẫn như khi bạn không sử dụng lời nhắc văn bản. Lưu ý rằng quá trình trải qua vẫn sẽ trải qua hình ảnh hợp lý, giống như quả bóng rổ hoặc ly rượu dưới đây, nhưng nó có thể là bất cứ điều gì. Bước trải qua thực sự được thực hiện là sự khác biệt giữa mẫu có điều kiện và mẫu không điều kiện. Quá trình này được lặp lại cho số lượng bước mẫu.

negative prompt hoạt động

Không có negative prompt, bước trải qua một quá trình trải nghiệm dưới sự hướng dẫn của lời nhắc và xa cách xa khỏi những hình ảnh ngẫu nhiên.

Mẫu với negative prompt

Negative prompt được thực hiện bằng cách chiếm đoạt sự mẫu vô điều kiện. Thay vì sử dụng một lời nhắc trống rỗng tạo ra hình ảnh ngẫu nhiên, ta sử dụng negative prompt.

negative prompt hoạt động

Khi sử dụng negative prompt, một bước trải qua là một bước hướng về positive prompt và xa lánh negative prompt.

Kỹ thuật, lời nhắc tích cực điều khiển quá trình trải qua hướng tới hình ảnh liên quan, trong khi negative prompt lại đưa quá trình trải qua xa khỏi nó. Lưu ý rằng quá trình trải qua trong Stable Diffusion diễn ra trong không gian ẩn, không phải là hình ảnh. Các hình ảnh trên không gian hình ảnh ở trên chỉ mang tính minh họa. Xem bài viết tuyệt vời này nếu bạn quan tâm đến cách nó được thực hiện ở mức mã.

Không gian mẫu

Hãy xem xét hình minh hoạ về không gian mẫu sau đây. Khi sử dụng lời nhắc “Portrait photo of a man”, Stable Diffusion sẽ lấy mẫu hình ảnh từ toàn bộ không gian ẩn của tất cả nam giới, có và không có ria mép. Bạn sẽ nhận được hình ảnh của nam giới có và không có nó.

Không gian của tất cả hình ảnh nam giới. Khi negative prompt “mustache” được thêm vào, không gian “Men with mustach” bị loại trừ. Thực tế, chúng ta đang lấy mẫu hình ảnh từ nam giới không có ria mép.

Để biết thêm thông tin chi tiết về Stable Diffusion có thể tìm hiểu thêm tại khóa học Stable Diffusion – Midjourney tại Arcline Academy hoặc có thể tham khảo thêm thông tin các khóa học khác tại đây        

Trụ sở chính: 32/19 Nghĩa Hòa, Phường 06, Q. Tân Bình, TPHCM (Nhà Thờ Nghĩa Hòa – Khu Bắc Hải)

Trụ sở miền Tây: L30-09, Đường số 43, Khu Dân cư Stella Megacity, P. Bình Thủy, Q. Bình Thủy, Tp. Cần Thơ

Hotline: 0988 363 967

Comments are closed.