認識Stable Diffusion的txt2img

透過此任務我將獲得: Through this task I will gain:
 
20

分析力

20

溝通力

20

實踐力

20

主動力

20

創造力

 

取樣方法與步驟及其他文生圖相關設定

 


1.     了解什麼是取樣方法、

2.     了解什麼是取樣步驟

3.     寬、高、CFG Scale、提示詞相關性(CFG)、Batch count產生批次、Seed隨機種子

主要教學內容

一、 什麼是取樣方法Sampling method呢?可以簡單想像是模型計算中用不同的方法去演算,因此會影響算出的結果和品質,要注意的是隨著Stable Diffusion的版本更新,你電腦中的Sampling method取樣方法數量可能會與本任務的版本有所不同,你可以更新你Stable Diffusion的版本。個人常用的Sampling method取樣方法有三種,依序是Euler aDPM++2M KarrasDPM++ SDE Karras等,不同的取樣方法與不同的取樣步驟其生成結果與生成速度大不相同。

 

 

二、  什麼是取樣步驟Sampling steps呢?首先選一個取樣方法Sampling method,接著設定的取樣步驟Sampling steps數字的多寡,就關係到你生成圖像的時間長短與細緻與否,基本上取樣步驟的數字愈大則越細緻、其圖像生成所需時間也越久,如把取樣步驟設到最大,會得到更細緻的圖像,或是你硬體資源不足無法生成圖像。常用的取樣步驟Sampling steps其數值是介於20 ~ 28之間,下方兩張圖是刻意下相同的文字指令Prompt,設相同的取樣方法Sampling method,在這個例子中我們選擇 DPM++ SDE Karras ,然後其取樣步驟Sampling steps分別是取樣步驟Sampling steps20跟取樣步驟Sampling steps150,你就可以很明顯的分辨看出兩張圖像上的差異了。

 

 

上圖是取樣步驟Sampling steps設成20的螢幕操作畫面,下圖是取樣步驟Sampling steps設成150的螢幕操作畫面,由此可知在相同的文字指令Promopt下,取樣步驟Sampling steps數字的多寡真的會影響生成圖像的品質與精細度,甚至連視角、顏色、膚色、外觀都會有所影響,當然還有另一個可變因素就是模型Model了,你選擇什麼Checkpoint模型與LoRA模型都會影響到你生成圖像的品質,但是千萬不要以為步驟數字越高畫質就越好,那只是在那些設定之間有互相關聯並不是一定的,所以唯有不斷的變更模型與測試、設定找出最適合、最接近、趨近於你內心想要的圖像即可。

 

 

 

 

 

三、  接著來了解一下看看什麼是寬、高、CFG Scale提示詞相關性(CFG)、Batch count產生批次、Seed隨機種子

 

 

l   Width寬度:這不用說也知道就是設定所生成圖形左到右的寬度,通常內建不管長、寬都是設定成512

l   Height高度:設定生成圖形垂直上到下高度的欄位,其內建跟寬度一樣也是512,如長、寬同樣是512 x 512,則生成的是一張正方型的圖,所以建議高度可以設成768,變成長方形不管是直式或橫式長方形,設成512 x 76823的圖形也較符合一般圖片尺寸的型態。

l   Batch count產生批次和Batch size每批數量:這兩個設定的差異在於Batch count產生批次是按下Generate產生鍵後,你要電腦跑幾次算圖;而Batch size每批數量是指在單一算圖的計算過程中你要電腦生成幾張圖,如果在Batch size每批數量中設定4,也就是要電腦一次生成四張圖形,所以,如Batch size每批數量設定數字越高,則電腦需要耗費更多時間與更多的記憶體去計算生成這四張圖,但如果在Batch count產生批次欄位中設定更高數字,讓電腦去依輸入的數字去批次算圖,建議可以更新顯卡已增快算圖的速度,如硬體效能較差的話,建議Batch count產生批次欄位設定1就好。

l   CFG Scale提示詞相關性(CFG):這個欄位的數值最低是從1到最高30之間,簡單來說就是設定Stable Diffusion對文字指令Prompt自主的控制程度,當CFG Scale設成1的時候,就是完全不考慮Prompt任由Stable Diffusion去自主生成圖形,如要在Stable Diffusion自主生成圖形與你設定的Prompt文字指令之間達到一個 50% 50% 的平衡點的話,那CFG Scale就要設成7,這樣一半聽從Stable Diffusion一半聽從你的Prompt指令兩邊就會達到平衡,然後數字開始往上增加,當設定到達最頂30的時候,Stable Diffusion就完全依照你的文字指令去生成圖形;所以數字越小干預越多,數字越大則越少,故建議CFG Scale的數值就設定在7左右較為適合,當然可以多變換設定幾次或是變更基底模型ModelLora試試,其結果必定有所不同。

 

l   Seed隨機種子:什麼是Seed隨機種子?其實就是電腦隨機所生成的圖形,每個圖形都有一個隨機生成的種子碼,不同的Seed種子碼會生成不同的圖形,而相同的種子碼就會產生一樣的圖形,所以,我們設定相同的文字指令PromptCFG Scale提示詞相關性與WidthHeight等等的參數,只要變更換掉Seed的數字,就能生成一張完全不一樣的圖形。如要在Stable Diffusion設定成自動隨機生成圖形,記得在Seed欄位中填入-1這個數字,讓電腦每次算圖都自動產生不同的 Seed 值去生成圖形。

 

其他建議學習

1. 資料來源:最詳細的 Stable diffusion WebUI 操作教學 – txt2img

2. 資料來源:關於Stable Diffusion模型你所有該知道的知識

評量 Evaluation 1: 下列選項中如欲令Stable Diffusion隨機產生Seed種子,請問要選擇何種指令?



 已過關  未過關  目前關