No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
No events
分析力
溝通力
實踐力
主動力
創造力
1. 了解什麼是取樣方法、
2. 了解什麼是取樣步驟。
3. 寬、高、CFG Scale、提示詞相關性(CFG)、Batch count產生批次、Seed隨機種子
主要教學內容:
一、 什麼是取樣方法Sampling method呢?可以簡單想像是模型計算中用不同的方法去演算,因此會影響算出的結果和品質,要注意的是隨著Stable Diffusion的版本更新,你電腦中的Sampling method取樣方法數量可能會與本任務的版本有所不同,你可以更新你Stable Diffusion的版本。個人常用的Sampling method取樣方法有三種,依序是Euler a、DPM++2M Karras、DPM++ SDE Karras等,不同的取樣方法與不同的取樣步驟其生成結果與生成速度大不相同。
二、 什麼是取樣步驟Sampling steps呢?首先選一個取樣方法Sampling method,接著設定的取樣步驟Sampling steps數字的多寡,就關係到你生成圖像的時間長短與細緻與否,基本上取樣步驟的數字愈大則越細緻、其圖像生成所需時間也越久,如把取樣步驟設到最大,會得到更細緻的圖像,或是你硬體資源不足無法生成圖像。常用的取樣步驟Sampling steps其數值是介於20 ~ 28之間,下方兩張圖是刻意下相同的文字指令Prompt,設相同的取樣方法Sampling method,在這個例子中我們選擇 DPM++ SDE Karras ,然後其取樣步驟Sampling steps分別是取樣步驟Sampling steps:20跟取樣步驟Sampling steps:150,你就可以很明顯的分辨看出兩張圖像上的差異了。
上圖是取樣步驟Sampling steps設成20的螢幕操作畫面,下圖是取樣步驟Sampling steps設成150的螢幕操作畫面,由此可知在相同的文字指令Promopt下,取樣步驟Sampling steps數字的多寡真的會影響生成圖像的品質與精細度,甚至連視角、顏色、膚色、外觀都會有所影響,當然還有另一個可變因素就是模型Model了,你選擇什麼Checkpoint模型與LoRA模型都會影響到你生成圖像的品質,但是千萬不要以為步驟數字越高畫質就越好,那只是在那些設定之間有互相關聯並不是一定的,所以唯有不斷的變更模型與測試、設定找出最適合、最接近、趨近於你內心想要的圖像即可。
三、 接著來了解一下看看什麼是寬、高、CFG Scale提示詞相關性(CFG)、Batch count產生批次、Seed隨機種子。
l Width寬度:這不用說也知道就是設定所生成圖形左到右的寬度,通常內建不管長、寬都是設定成512
l Height高度:設定生成圖形垂直上到下高度的欄位,其內建跟寬度一樣也是512,如長、寬同樣是512 x 512,則生成的是一張正方型的圖,所以建議高度可以設成768,變成長方形不管是直式或橫式長方形,設成512 x 768的2:3的圖形也較符合一般圖片尺寸的型態。
l Batch count產生批次和Batch size每批數量:這兩個設定的差異在於Batch count產生批次是按下Generate產生鍵後,你要電腦跑幾次算圖;而Batch size每批數量是指在單一算圖的計算過程中你要電腦生成幾張圖,如果在Batch size每批數量中設定4,也就是要電腦一次生成四張圖形,所以,如Batch size每批數量設定數字越高,則電腦需要耗費更多時間與更多的記憶體去計算生成這四張圖,但如果在Batch count產生批次欄位中設定更高數字,讓電腦去依輸入的數字去批次算圖,建議可以更新顯卡已增快算圖的速度,如硬體效能較差的話,建議Batch count產生批次欄位設定1就好。
l CFG Scale提示詞相關性(CFG):這個欄位的數值最低是從1到最高30之間,簡單來說就是設定Stable Diffusion對文字指令Prompt自主的控制程度,當CFG Scale設成1的時候,就是完全不考慮Prompt任由Stable Diffusion去自主生成圖形,如要在Stable Diffusion自主生成圖形與你設定的Prompt文字指令之間達到一個 50% 與 50% 的平衡點的話,那CFG Scale就要設成7,這樣一半聽從Stable Diffusion一半聽從你的Prompt指令兩邊就會達到平衡,然後數字開始往上增加,當設定到達最頂30的時候,Stable Diffusion就完全依照你的文字指令去生成圖形;所以數字越小干預越多,數字越大則越少,故建議CFG Scale的數值就設定在7左右較為適合,當然可以多變換設定幾次或是變更基底模型Model與Lora試試,其結果必定有所不同。
l Seed隨機種子:什麼是Seed隨機種子?其實就是電腦隨機所生成的圖形,每個圖形都有一個隨機生成的種子碼,不同的Seed種子碼會生成不同的圖形,而相同的種子碼就會產生一樣的圖形,所以,我們設定相同的文字指令Prompt、CFG Scale提示詞相關性與Width、Height等等的參數,只要變更換掉Seed的數字,就能生成一張完全不一樣的圖形。如要在Stable Diffusion設定成自動隨機生成圖形,記得在Seed欄位中填入-1這個數字,讓電腦每次算圖都自動產生不同的 Seed 值去生成圖形。
其他建議學習:
1. 資料來源:最詳細的 Stable diffusion WebUI 操作教學 – txt2img
2. 資料來源:關於Stable Diffusion模型你所有該知道的知識