Liệu ChatGPT có thể tạo ra những gợi ý chất lượng cao cho Stable Diffusion? Câu trả lời là có. Nhưng bạn sẽ cần các phương pháp đặc biệt để tạo ra chúng. Một khi bạn đã học cách thực hiện, kết quả sẽ khiến bạn bất ngờ. Trong bài viết này, tôi sẽ hướng dẫn bạn từng bước làm điều đó.
ChatGPT là gì?
ChatGPT là một chatbot được Open AI ra mắt vào tháng 11 năm 2022. Nó được xây dựng dựa trên gia đình GPT-3 của mô hình Ngôn ngữ Lớn, đã được huấn luyện với hàng trăm tỷ từ trong văn bản trên internet.
Một cuốn sách có hàng trăm tỷ từ có chiều dài như thế nào? Một người sẽ mất hơn năm ngàn năm để đọc hết tất cả.
Do đó, ChatGPT chứa lượng kiến thức rộng lớn của con người. Nó có thể tạo ra các bài tiểu luận, bài thơ, tác phẩm hư cấu và thậm chí là các đoạn mã máy tính.
ChatGPT được huấn luyện như thế nào?
ChatGPT được điều chỉnh lại trên GPT-3.5. GPT-3 chính nó đã là một mô hình ngôn ngữ lớn mạnh mẽ. Nó hoạt động như tự động hoàn thiện văn bản. Bạn gõ một vài từ hoặc một vài câu, mô hình dự đoán các từ tiếp theo có khả năng cao nhất. Bởi vì lượng lớn dữ liệu mà nó được huấn luyện, tính năng tự động hoàn thiện của GPT-3 là vô cùng mạnh mẽ. Nó có thể tạo ra một bài tiểu luận có nội dung liên kết và (đôi khi) chính xác.
Người huấn luyện đóng vai trò quan trọng trong việc điều chỉnh lại câu trả lời của ChatGPT. Mô hình được huấn luyện để cung cấp các câu trả lời mà những người huấn luyện con người sẽ cung cấp. Người huấn luyện cũng xếp hạng các câu trả lời của ChatGPT trong giai đoạn huấn luyện để nó ưu tiên các câu trả lời mà con người ưa thích.
Liệu ChatGPT có biết gì về Stable Diffusion không?
Rất tiếc, câu trả lời là không. Bạn có thể dễ dàng kiểm tra bằng cách hỏi ChatGPT câu hỏi “Stable Diffusion là gì?”. Câu trả lời của nó là:
Stable diffusion liên quan đến một loại quá trình ngẫu nhiên mô tả sự lan truyền của một lượng nhất định, chẳng hạn như thông tin hoặc một căn bệnh, thông qua mạng lưới của các cá nhân hoặc nút. Thuật ngữ “stable” được sử dụng để chỉ ra rằng quá trình đạt đến một trạng thái cân bằng, trong đó tỷ lệ mà lượng truyền qua mạng lưới được cân bằng bởi tỷ lệ mà nó suy giảm. Ví dụ phổ biến nhất về stable diffusion là việc lan truyền tin đồn thông qua mạng xã hội. |
Chúng ta có thể tranh luận xem đây có phải là một điều vô lý hoàn toàn, nhưng chúng ta nên đồng ý rằng đây KHÔNG PHẢI là Stable Diffusion. Dữ liệu huấn luyện của nó có thể trước khi Stable Diffusion được ra mắt.
May mắn thay, nó biết về các mô hình text-to-image và DALL·E (Bạn có thể kiểm tra). Vì vậy, chúng ta có thể sử dụng chúng trong việc tạo gợi ý.
Cách sử dụng ChatGPT
Để bắt đầu sử dụng ChatGPT, hãy truy cập vào chat.openai.com. Nhập câu hỏi vào ô đầu vào ở phía dưới để bắt đầu cuộc trò chuyện.
Trang ChatGPT
ChatGPT nhớ lịch sử cuộc trò chuyện hiện tại của bạn. Nhấn nút “+ New Chat” trên bảng điều khiển bên trái để bắt đầu cuộc trò chuyện mới.
Xem thêm: Bí quyết tạo hình ảnh động vật sống động với Stable Diffusion
Yêu cầu về gợi ý
Tôi sẽ thử nghiệm ChatGPT bằng cách yêu cầu gợi ý cho bức chân dung minh họa, một trong những loại khó nhất để tạo ra gợi ý chính xác. Hãy xem nó hoạt động như thế nào.
Close-up illustration
Có ba kỹ thuật quan trọng để nhận được các gợi ý chất lượng cao cho Stable Diffusion từ ChatGPT:
- Chỉ định phong cách ảnh. Bạn cần yêu cầu một loại hình ảnh cụ thể. Trong ví dụ của tôi, tôi sẽ yêu cầu “chân dung từ gần hình ảnh sống động”.
- Xác định chủ đề. Tôi sẽ xác định chủ đề là nữ diễn viên “Ana de Armas”. Tôi không (quá) ám ảnh với Ana de Armas. Lý do là tên nữ diễn viên là một từ khóa mạnh. Không chỉ nó sẽ thay đổi khuôn mặt (như ý muốn) mà nó còn ảnh hưởng nặng nề đến phong cách (không ý muốn). Nếu chủ đề không được xác định, ChatGPT sẽ sử dụng một nữ diễn viên khác trong mỗi gợi ý.
- Phong cách và cấu trúc có thể thay đổi đơn giản chỉ vì điều đó. Mở đầu bằng các ví dụ. Cuối cùng, hãy cung cấp hai gợi ý ví dụ.
Kết hợp những yếu tố này, gợi ý của ChatGPT là:
Các ví dụ về gợi ý chất lượng cao cho chân dung từ gần hình ảnh sống động của Ana de Armas cho các mô hình text-to-image (Stable Diffusion, midjourney hoặc Dalle2) là:
Hãy cho tôi thêm các ví dụ khác. |
Câu trả lời của ChatGPT:
|
Hãy đặt những gợi ý này vào Stable Diffusion v1.5. Tôi sẽ sử dụng 25 bước mẫu DPM++ 2M Karras, tỷ lệ CFG 7, kích thước ảnh 512×704. Tôi sẽ sử dụng gợi ý tiêu chuẩn tiêu cực sau đây.
xấu xí, lặp đi lặp lại, vẽ tay không đẹp, vẽ chân không đẹp, vẽ mặt không đẹp, ngoài khung, cánh tay thừa, biến dạng, cơ thể ngoài khung, nghệ thuật kém, người mới, người tự học, mặt biến dạng |
Gợi ý của ChatGPT Số #1: Một bức chân dung từ gần tuyệt đẹp của Ana de Armas trong một phong cách đen tối, u ám và nghi ngờ, lấy cảm hứng từ công việc của Simon Stålenhag, với những chi tiết tỉ mỉ và một cảm giác bí ẩn.
Gợi ý của ChatGPT Số #2: Một bức chân dung chân thực, siêu chi tiết của Ana de Armas trong phong cách Hollywood cổ điển, gợi nhớ đến thời kỳ vàng của điện ảnh, với tập trung vào sự quyến rũ và thanh lịch.
Gợi ý của ChatGPT Số #3: Một bức chân dung từ gần của Ana de Armas trong phong cách neo-noir, gợi nhớ đến thể loại film noir, với sự tập trung vào bóng tối, đối lập và một cảm giác nguy hiểm.
Những gì tuyệt vời! Tôi rất ngạc nhiên với tính sáng tạo của các gợi ý và đa dạng phong cách mà nó mang lại.
Và tôi chắc chắn đã học được một số từ khóa mới mà tôi sẽ sử dụng trong trình tạo gợi ý.
Hình minh hoạ toàn thân
Bây giờ hãy tinh chỉnh gợi ý của ChatGPT để tìm ra các gợi ý cho hình minh hoạ toàn thân. Bạn chỉ cần thêm “toàn thân” vào câu hỏi và các ví dụ gợi ý của bạn.
Dưới đây là các ví dụ về gợi ý chất lượng cao cho hình minh hoạ toàn thân siêu thực đẹp của Ana de Armas cho các mô hình văn bản thành hình (Stable Diffusion, midjourney hoặc Dalle2):
Hãy cho tôi thêm ví dụ. |
Dưới đây là các gợi ý mà ChatGPT đã tạo ra:
Gợi ý ChatGPT số 4: Hình minh hoạ toàn thân của Ana de Armas trong chiếc váy đỏ đẹp mắt, khoe sắc màu trước bối cảnh hoàng hôn tuyệt đẹp, với ánh sáng và bóng tự nhiên, của một nghệ sĩ kỹ thuật số lão luyện nổi tiếng với phong cách siêu thực của họ, như Jomaro Kindred hoặc Gleb Alexandrov
Gợi ý ChatGPT số 5: Một hình minh hoạ toàn thân của Ana de Armas như một nữ hoàng chiến binh mạnh mẽ, với bộ giáp và vũ khí phức tạp, trong tư thế động đậy và hành động, được thể hiện trong phong cách siêu thực chi tiết và đẹp mắt bởi các nghệ sĩ fantasy hàng đầu như Simon Stålenhag hoặc Jora Vision
Gợi ý ChatGPT số 6: Một hình minh hoạ toàn thân của Ana de Armas như một phù thuỷ quyến rũ và bí ẩn, với trang phục và phụ kiện chi tiết và thực tế, trong tư thế nghệ sĩ và hấp dẫn, bởi các nghệ sĩ hàng đầu về thể loại fantasy và khoa học viễn tưởng như Yoshitaka Amano hoặc Dave Rapoza.
Đây đều là những gợi ý tốt, chất lượng và phong cách chân dung từ gần!
Yêu cầu thêm
Nếu bạn thích một gợi ý cụ thể mà ChatGPT đã đưa ra, bạn có thể yêu cầu thêm bằng cách như sau:
Tôi thích cái thứ ba. Bạn có thể cho tôi thêm các ví dụ khác giống như vậy không? |
ChatGPT sẽ đưa cho bạn thêm các biến thể khác của cùng một phong cách.
Để biết thêm thông tin chi tiết về Stable Diffusion có thể tìm hiểu thêm tại khóa học Stable Diffusion – Midjourney tại Arcline Academy hoặc có thể tham khảo thêm thông tin các khóa học khác tại đây
Trụ sở chính: 32/19 Nghĩa Hòa, Phường 06, Q. Tân Bình, TPHCM (Nhà Thờ Nghĩa Hòa – Khu Bắc Hải)
Trụ sở miền Tây: L30-09, Đường số 43, Khu Dân cư Stella Megacity, P. Bình Thủy, Q. Bình Thủy, Tp. Cần Thơ
Hotline: 0988 363 967