要執行 ControlNet tile upscale:
您想使用 Stable Diffusion 創建包含大量細節的大型圖像嗎?您將需要使用升頻器。在本文中,您將學習 3 種放大圖像的方法。
- 人工智能升級器
- 標清高檔
- ControlNet瓷磚高檔
您將看到比較并了解這些方法的優缺點。
如果您不熟悉該主題,則可能需要學習升頻器的基礎知識。
軟件
我們將使用 AUTOMATIC1111 ?Stable Diffusion GUI 來執行放大。您可以在Windows、? Mac或 Google Colab上使用此 GUI ?。
對于最后一種方法,我們需要Ultimate SD Upscale和ControlNet擴展。
Colab 用戶
如果您使用本站提供的Colab Notebook,您只需在啟動筆記本前選擇ControlNet和Ultimate SD Upscale擴展。
Windows 或 Mac 用戶
安裝 Ultimate SD 高級擴展
Ultimate SD upscale是一個擴展,提供類似于內置SD Upscale腳本的功能,但具有一些高級選項。
在 AUTOMATIC1111 中安裝 Ultimate SD upscale:
-
導航到**“擴展”**頁面。
-
選擇從 URL 安裝選項卡。
-
將以下 URL 放入擴展存儲庫字段的 URL 中。
https://github.com/Coyote-A/ultimate-upscale-for-automatic1111
-
單擊安裝按鈕。
-
等待擴展安裝成功的確認消息。
-
重新啟動 AUTOMATIC1111。
如果安裝成功,您應該會在img2img頁面底部的腳本下拉菜單中看到Ultimate SD upscale。
安裝 ControlNet 擴展
ControlNet是一個擴展,可讓您額外控制圖像生成。請參閱ControlNet 教程以了解更多信息。
在 AUTOMATIC1111 中安裝 Ultimate SD upscale:
-
導航到**“擴展”**頁面。
-
選擇從 URL 安裝選項卡。
-
將以下 URL 放入擴展存儲庫字段的 URL 中。
https://github.com/Mikubill/sd-webui-controlnet
-
單擊安裝按鈕。
-
等待說明擴展已安裝的確認消息。
-
重新啟動 AUTOMATIC1111。
-
訪問ControlNet 模型頁面。
-
下載所有模型文件(文件名以 結尾
.pth
)。如果您不想全部下載,您可以只下載_tile
本教程的瓦片模型(結尾為 )。 -
將模型文件放入 ControlNet 擴展的模型目錄中。
穩定擴散-webui\extensions\sd-webui-controlnet\models
- 重新啟動 AUTOMATIC1111。
您應該在 txt2img 頁面上看到 ControlNet 部分。瓷磚模型應該可以在模型下拉菜單中進行選擇。如果看不到菜單,請按菜單旁邊的刷新按鈕。
輸入圖像
我們將使用 Stable Diffusion 生成的以下圖像。
型號:Lyriel v1.5
提示與否定提示:
“最后一舞”:在一個盛大的舞廳里,我們命運多舛的戀人共舞。當他們跳華爾茲時,時間似乎變慢了,迷失在彼此的眼中。他們不知道,這將是命運介入之前他們在一起的最后時刻。
(我從 GPT-4 得到了這個提示)
毀容的,變形的
原始尺寸非常小(768×512 像素)。讓我們將其放大 4 倍至 3,072×2,048 像素。我們將使用三種放大方法進行測試。
- 人工智能升級器
- 標清高檔
- ControlNet瓷磚高檔
方法一:AI Upscaler
AI Upscaler是一種AI 模型,經過訓練可以放大照片并填充細節,從而使圖像保持清晰。這是在 AUTOMATIC1111 中放大圖像的基本方法。
-
在 AUTOMATIC1111 中,導航到Extras頁面。
-
將圖像上傳到圖像畫布。
-
將Resize設置為 4。(將圖像放大 4 倍。)
4. 在Upscaler 1中選擇一個 upscaler 。我使用了Universal Upscaler v2,但你可以使用任何一個。(請參閱此處下載和安裝新的升級器的說明)
- 點擊生成。
片刻之后,您將在右側的輸出窗口中看到放大后的圖像。
讓我們看看進展如何。我們先來看看裙子。
它在忠實地填充裙子的細節方面做得不錯。
但是這位女士的臉需要一些超出這個升級器所能做的增強。
當然,你可以開啟人臉修復,它使用另一個AI模型來修復人臉。但是因為模型沒有用這種特殊的風格進行訓練,它可能會引入偽像并使面部看起來不自然。
方法二:標清高檔
有沒有什么方法可以不使用面部修復來修復面部?
首先,這張臉有點像原始圖像中的那張臉。這就是為什么我們在擴大規模時得到了我們所得到的。
但是,如果您接受更多更改,因為原始圖像無論如何都是計算機生成的呢?您可以執行一輪額外的圖像到圖像以重新生成細節。
這正是 SD 高檔腳本所做的。
這種方法的好處是
- 可以使用相同的模型和提示生成新的放大細節。
- 移除由 AI upscaler 引入的偽影。
您可以使用AUTOMATIC1111 中 img2img 頁面上的SD Upscale腳本輕松地同時執行 AI upscaling 和 SD img2img。該腳本在小塊中執行穩定擴散 img2img,因此它適用于低 VRAM GPU 卡。
分步指南
按照以下步驟執行 SD 升級。
- 在img2img頁面,將圖片上傳到 Image Canvas。
2.輸入原提示和否定提示。如果您沒有原始提示,您可以使用“非常詳細”。
備選方案 1:如果您剛剛在txt2img頁面上生成圖像,請單擊發送到 img2img按鈕。圖像和提示將自動填充。
備選方案 2:如果您將生成的圖像保存在本地存儲中,則可以將其上傳到PNG 信息頁面。您應該會看到生成此圖像的所有信息,包括提示和模型。單擊發送到 img2img。圖像和提示將自動填充。
-
在穩定擴散檢查點下拉菜單中,選擇生成此圖像時最初使用的模型
-
將圖像寬度和高度都設置為 512。這是用于 SD 放大的圖塊大小。
-
將去噪強度設置為 0.3。較高的值將導致更多的細節和恢復,但不應將其設置為高于 0.4。否則,您會看到偽影。
5. 在img2img頁面的按鈕附近找到腳本下拉菜單。選擇標清高檔。
-
將比例因子設置為 4 以放大 4 倍。
-
選擇一個升頻器。我選擇了與之前方法相同的升頻器。但如果沒有,您可以選擇 ESRGAN 或 R-ESRGAN。
- 單擊生成。
結果
這就是我得到的。
得益于 Stable Diffusion img2img,硬木地板有很多細節。
現在讓我們比較一下臉。
不錯的改進!SD upscale 在不引入偽像的情況下修復面部。
讓我們檢查一下這件衣服,好嗎?
他們也有更多的細節。
您可以嘗試使用以下參數。
- 采樣步長:設置為更高的值,例如 50 – 100,可以獲得更多的細節。
- 抽樣法。細節可能不同,尤其是祖先采樣器。
- 去鼻強度。控制要添加多少細節。此方法的可行范圍在 0.1 和 0.4 之間。
- 種子:改變細節。
細節級別由去噪強度參數控制。正如我之前所說,如果將其設置為高于 0.4,則此方法會失效,因為穩定擴散會使圖像改變太多。您將開始看到人工制品。
有什么方法可以在不犧牲原始構圖的情況下增加去噪強度?嗯……這聽起來非常類似于從參考圖像復制構圖的擴展功能……
這是正確的。解決方案是使用ControlNet!
方法 3:ControlNet 平鋪高檔
ControlNet tile是一種用于重新生成圖像細節的 ControlNet 模型。如果本地圖片詳情與提示不符,則忽略提示,填寫本地詳情。這種行為使其非常適合在圖塊中放大,因此它適用于低 VRAM 設置。
您需要安裝Ultimate SD Upscale和ControlNet擴展才能使用此方法。如果您還沒有這樣做,請按照軟件部分中的說明進行操作。
我不知道為什么這種方法不適用于內置的 SD Upscale 腳本。它應該,但它沒有。
分步指南
要執行 ControlNet tile upscale:
-
導航到AUTOMATIC1111 中的img2img頁面。
-
將您的圖像上傳到img2img 畫布。
3.輸入原提示和否定提示。如果您沒有原始提示,您可以使用“非常詳細”。
備選方案 1:如果您剛剛在 txt2img 頁面上生成圖像,則可以單擊發送到 img2img按鈕。圖像和提示將自動填充在img2img頁面上。
備選方案 2:如果您在本地圖像中保存了生成的圖像,請將其上傳到PNG 信息頁面。您應該會看到生成此圖像的所有信息,包括提示和模型。單擊發送到 img2img。圖像和提示將自動填充。在img2img頁面上。
-
將采樣步數設置為 50。
-
將去噪強度設置為 0.5。
以下步驟適用于ControlNet部分。
-
將相同的原始圖像上傳到 ControlNet 的圖像畫布。
-
選擇啟用以啟用 ControlNet 擴展。
8.在預處理器下拉菜單中選擇tile_resample。
9.在模型下拉菜單中選擇control_v…_sd15_tile。
以下步驟適用于Ultimate SD Upscale擴展。
-
在頁面底部附近的腳本下拉菜單中,選擇****Ultimate SD Upscale。
-
在Target size type下拉菜單中,選擇Scale from image size。
-
將比例設置為 4。
-
選擇一個升頻器。我使用了 Universal Upscaler v2。但是您可以為通用升頻器選擇 ESRGAN 或 R-ESRGAN。
-
確認 Tile 寬度為 512,高度為 0。這將在放大期間使用 512×512 tile。
-
單擊生成。
結果
這是放大后的圖像。
讓我們放大比較。
這是面孔。
驚人的!ControlNet 磁貼升級的質量無異于改變生活。面部和頭發的渲染非常清晰,有很多細節。
現在讓我們檢查一下這件衣服。
看到添加了多少細節讓我大吃一驚!
這種方法的缺點可能是添加了太多細節。它可能會以某種方式改變圖像,使其不再是原始圖像的忠實放大。但這取決于你的目標。
參數調整
您可以嘗試使用以下參數。
- 降噪強度:降低它以減少添加的細節量。根據我的經驗,最高合理值是 0.5。
- 下采樣率(ControlNet):控制對控制塊進行多少下采樣。增加此值會使控制圖像更加模糊。控制圖像越隱蔽,模型在制作細節時就越自由。
- 采樣步數:增加步數往往會改善細節和清晰度。
- Sampling method : 和SD Upscale一樣,sampler可以起到最后細節的作用。
- 種子:更改種子以更改詳細信息。
- Seam fix (Ultimate SD Upscale):如果您覺得可以看到 512×512 的拼貼,請啟用。此選項會沿著圖塊的邊界運行額外的一輪放大。
你應該使用哪一個?
在三個升級選項中 — AI 升級、SD 升級和 ControlNet tile 升級,您應該使用哪一個?
在開始推薦之前,我認為 SD upscale 和 ControlNet tile upscale 的用例是相似的。ControlNet tile 高檔是優越的。在任何情況下,您都不會想要使用 SD upscale 而不是 ControlNet tile upscale。
所以它歸結為 2 個選擇:(1) AI upscaler,和 (2) ControlNet tile upscale。
由于您通常會在 ControlNet tile 操作之前使用 AI upscale 對圖像進行 upscale,因此本質上歸結為是否使用 ControlNet tile conditioning 執行額外的圖像到圖像。
如果您使用的是真實照片或保真度對您很重要,您可能希望放棄 ControlNet tile 并僅使用 AI upscaler。有許多AI 升頻器可用于不同類型的圖像。
事實上,即使是這些 AI upscalers 也會彌補細節,因此請明智地使用它們。
如果您還可以甚至更喜歡添加細節,ControlNet tile upscale 是您的不二之選。這適用于使用 Stable Diffusion 或其他 AI 圖像生成器生成的圖像。
[
本文使用 文章同步助手 同步