체크포인트 (Checkpoint)
역할: 모델의 메인 모듈로, 선택한 모델에 따라 생성되는 이미지의 전체적인 스타일이 결정됩니다.
VAE (Variational Autoencoder)
역할: 데이터 분포의 잠재 공간을 학습하여 이미지의 품질을 보정하는 역할을 합니다.
Lora (Low-Rank Adaptation)
역할: 추가 학습 기법인 드림부스를 기반으로 하여 모델에 새로운 피사체를 학습시키는 역할을 하며, 이미지 생성에 큰 영향을 줍니다.
임베딩 (Embedding)
역할: 모델에 직접적인 영향을 주지 않으면서 프롬프트를 추가 학습하는 방법으로, 특정한 특징을 모델에 추가합니다.
하이퍼 네트워크 (Hyper Network)
역할: 임베딩과 유사하지만 더 큰 영향력을 가지고 모델에 '공부'를 시키는 역할을 합니다.
프롬프트 (Prompt)
역할: 이미지 생성의 핵심 코드로, 사용자가 원하는 그림을 그리도록 AI에게 지시하는 문장이나 단어들의 집합입니다.
네거티브 프롬프트 (Negative Prompt)
역할: 이미지에서 제외하고 싶은 요소를 지정하는 데 사용되는 프롬프트입니다.
가중치
역할: 프롬프트 내 특정 키워드의 영향도를 조절합니다. 기본값은 1이며, 가중치 값을 조정하여 영향력을 조절할 수 있습니다.
태그형/문장형 프롬프트
역할: 이미지의 외모, 상태, 배경 등의 요소를 지정하는 태그형 프롬프트와 구도, 상황, 행위를 묘사하는 문장형 프롬프트로 구분됩니다.
샘플링 방법 (Sampling Method)
역할: 이미지 생성 시 선택하는 알고리즘의 종류를 의미합니다. 여기서 'DPM++ 2M Karras'는 특정한 딥러닝 샘플링 방법을 지칭합니다.
하이레스.픽스 (Hires. fix)
역할: 고해상도 이미지 생성 시 특정 문제를 해결하기 위한 설정입니다.
업스케일러 (Upscaler)
역할: 이미지의 해상도를 높이는 기능입니다. 'Latent'는 업스케일링 방식 중 하나를 지칭하며, 이는 이미지의 잠재 공간을 활용한 업스케일링을 의미합니다.
업스케일 바이 (Upscale by)
역할: 기본 이미지 크기에 비례하여 몇 배로 업스케일 할지 결정하는 설정값입니다.
하이레스 스텝스 (Hires steps)
역할: 고해상도 생성 시 반복적으로 진행될 스텝의 수를 설정합니다.
Inpaint Denoising Strength (인페인트 노이즈 제거 강도)
이 설정은 이미지를 수정할 때 얼마나 많은 변화를 주고 싶은지 결정합니다. 예를 들어, 값이 0이면 원본 이미지와 똑같이 유지하고, 1이면 완전히 새로운 이미지로 변환합니다. 예시: 사진 속 얼굴에 작은 주름을 없애고 싶다면 낮은 값(예: 0.2)을 사용하고, 얼굴을 완전히 다른 사람의 얼굴로 바꾸고 싶다면 높은 값(예: 0.8)을 사용합니다.
Inpaint Respective Field (인페인트 관련 필드)
이 설정은 이미지의 어느 부분을 수정할지 결정합니다. 다양한 옵션을 통해 원하는 부분을 더 자세하게 선택할 수 있습니다. 예시: 원본 이미지의 일부만 바꾸고 싶다면 'Original' 옵션을 사용하고, 이미지의 특정 부분을 완전히 새롭게 만들고 싶다면 'Latent Noise'를 사용합니다.
Mask Erode or Dilate (마스크 침식 또는 팽창)
이 설정은 이미지 수정시 마스크(수정할 부분)의 크기를 조절합니다. 양수 값은 마스크를 확장하고, 음수 값은 축소합니다. 예시: 얼굴의 일부를 수정하려면, 마스크를 해당 부분에 맞추고 양수 값으로 조정하여 마스크 크기를 살짝 늘릴 수 있습니다. 이렇게 하면 수정할 부분이 더 정확하게 선택됩니다.
리파이너 (Refiner)
역할: 이미지의 세부사항을 개선하기 위한 추가적인 처리 과정을 의미합니다.
너비 (Width), 높이 (Height)
역할: 생성할 이미지의 해상도를 결정합니다.
CFG (Guidance Scale)
Stable Diffusion의 Guidance Scale, 또는 CFG Scale은 AI가 이미지를 생성할 때 텍스트 프롬프트(지시문)를 얼마나 정확하게 따를지 결정하는 설정입니다. 간단히 말해서, 이 값이 높으면 AI는 프롬프트를 더 엄격하게 따르고, 낮으면 더 자유롭게 이미지를 생성합니다.
예를 들어:
낮은 CFG 값 (예: 1): AI는 프롬프트를 거의 무시하고 상당히 자유롭게 이미지를 생성합니다. 예를 들어, "노란색 꽃"이라는 프롬프트에 대해 AI는 노란색이 거의 없는 다양한 색의 꽃을 생성할 수 있습니다. 중간 CFG 값 (예: 7-9): AI는 프롬프트를 적당히 따르면서도 일정한 창의성을 유지합니다. "노란색 꽃"에 대해, AI는 주로 노란색 꽃을 생성하지만, 다른 색상의 요소나 독창적인 형태를 추가할 수도 있습니다. 높은 CFG 값 (예: 15 이상): AI는 프롬프트를 매우 엄격하게 따릅니다. 이 경우, "노란색 꽃"에 대해 AI는 거의 노란색만을 사용하여 정확한 꽃의 이미지를 생성할 것입니다.
시드 (Seed)
역할: 무작위성을 제어하여, 동일한 시드 값으로 동일한 이미지를 재생성할 수 있습니다.
스크립트 (Script)
역할: 이미지 생성 프로세스에 추가적인 스크립트를 적용할 수 있습니다.
샘플링 스텝스 (Sampling Steps)
역할: 이미지 생성 과정에서 모델이 반복하는 횟수를 지정합니다. 숫자가 높을수록 더 많은 계산을 거쳐 이미지를 생성하게 되며, 일반적으로 이미지 품질이 더 세밀해질 수 있습니다.
배치 카운트 (Batch Count)
역할: 한 번에 생성할 이미지의 배치(그룹) 수를 지정합니다. 예를 들어, 배치 카운트를 3으로 설정하면, 한 번의 요청으로 3개의 이미지가 생성됩니다.
배치 사이즈 (Batch Size)
역할: 각 배치 내에 포함될 이미지의 수를 지정합니다. 배치 사이즈를 높이면 동시에 더 많은 이미지를 생성할 수 있지만, 이는 시스템의 자원을 더 많이 소모하게 됩니다.
리사이즈 너비/높이 (Resize Width to / Resize Height to)
역할: 생성된 이미지를 특정한 너비나 높이로 조정합니다. 이는 이미지의 최종 해상도를 사용자가 원하는 크기로 맞출 때 사용됩니다.
노이즈 스케일 (Noise Scale)
역할: 생성 과정에서 이미지에 추가되는 노이즈의 양을 조절합니다. 더 높은 수치는 이미지에 더 많은 무작위성을 부여합니다.
초기 이미지 (Initial Image)
역할: 이미지 생성 시 시작점으로 사용될 기존 이미지를 지정합니다. 이를 통해 특정 이미지를 기반으로 새로운 이미지를 변형하거나 개선할 수 있습니다.
마스크 (Mask)
역할: 이미지의 특정 영역만을 수정하거나 변형하고 싶을 때 사용합니다. 마스크를 적용하면 해당 영역만 선택적으로 변형할 수 있습니다.
조건부 생성 (Conditional Generation)
역할: 특정 조건을 만족하는 이미지만을 생성하도록 모델을 조건화하는 기능입니다.
Inpainting
역할: 이미지의 특정 부분이 손상되었거나 제거되어야 할 때, 해당 부분을 자연스럽게 복원하거나 채우는 작업을 수행합니다.
Outpainting
역할: 주어진 이미지의 경계를 넘어서 확장하여 더 큰 이미지를 생성하는 기능입니다.
이미지 변환 (Image Transform)
역할: 이미지의 크기, 회전, 반전 등의 변형을 적용할 수 있습니다.
색상 조절 (Color Adjustment)
역할: 이미지의 색상, 채도, 명도 등을 조절하여 다른 느낌을 줄 수 있습니다.
알파 채널 (Alpha Channel)
역할: 이미지의 투명도를 조절할 수 있는 설정으로, 배경 제거나 오버레이 효과에 사용됩니다.
이미지 합성 (Image Composition)
역할: 두 개 이상의 이미지를 합쳐서 하나의 새로운 이미지를 생성하는 기능입니다.
텍스처 합성 (Texture Synthesis)
역할: 주어진 텍스처를 바탕으로, 그 패턴을 따라 이미지 전체에 적용하는 기능입니다.
스타일 전이 (Style Transfer)
역할: 한 이미지의 스타일을 다른 이미지에 적용하여 새로운 스타일을 생성합니다.
슈퍼 리졸루션 (Super Resolution)
역할: AI를 사용하여 이미지의 해상도를 극적으로 향상시키는 기술입니다. 이는 종종 이미지를 확대할 때 디테일을 유지하거나 복원하는 데 사용됩니다.
모델 인터폴레이션 (Model Interpolation)
역할: 두 개의 다른 훈련된 모델 사이의 중간점을 찾아서, 두 모델의 특성을 혼합한 새로운 이미지를 생성합니다.
스타일 믹싱 (Style Mixing)
역할: 여러 스타일의 특징을 조합하여, 하나의 이미지에 다양한 스타일을 적용하는 기술입니다.
특징 보강 (Feature Augmentation)
역할: 생성된 이미지에 추가적인 특징이나 속성을 부여하는 기능으로, 이미지의 복잡성과 표현력을 높입니다.
다중 프롬프트 조화 (Multi-Prompt Harmony)
역할: 여러 프롬프트를 조합하여 이미지 생성 시 동시에 반영함으로써, 복합적인 요구사항을 만족시키는 이미지를 생성합니다.
세대별 이미지 진화 (Generational Image Evolution)
역할: 이미지를 반복적으로 생성하고, 각 세대마다 변형을 가하여 점진적으로 결과를 개선하는 기술입니다.
심층 메타데이터 통합 (Deep Metadata Integration)
역할: 이미지와 함께 생성되는 메타데이터를 활용하여, 이미지의 생성 과정이나 특성을 더욱 풍부하게 만드는 기능입니다.
점진적 세밀화 (Progressive Refinement)
역할: 이미지를 점진적으로 세밀하게 만드는 과정을 통해, 최종 결과물의 품질을 향상시킵니다.
Stable Diffusion의 Guidance Scale, 또는 CFG Scale은 AI가 이미지를 생성할 때 텍스트 프롬프트(지시문)를 얼마나 정확하게 따를지 결정하는 설정입니다. 간단히 말해서, 이 값이 높으면 AI는 프롬프트를 더 엄격하게 따르고, 낮으면 더 자유롭게 이미지를 생성합니다.
예를 들어:
낮은 CFG 값 (예: 1): AI는 프롬프트를 거의 무시하고 상당히 자유롭게 이미지를 생성합니다. 예를 들어, "노란색 꽃"이라는 프롬프트에 대해 AI는 노란색이 거의 없는 다양한 색의 꽃을 생성할 수 있습니다. 중간 CFG 값 (예: 7-9): AI는 프롬프트를 적당히 따르면서도 일정한 창의성을 유지합니다. "노란색 꽃"에 대해, AI는 주로 노란색 꽃을 생성하지만, 다른 색상의 요소나 독창적인 형태를 추가할 수도 있습니다. 높은 CFG 값 (예: 15 이상): AI는 프롬프트를 매우 엄격하게 따릅니다. 이 경우, "노란색 꽃"에 대해 AI는 거의 노란색만을 사용하여 정확한 꽃의 이미지를 생성할 것입니다.
Adetailor
ADetailer는 Stable Diffusion의 확장 기능으로, 이미지의 특정 부분을 자동으로 감지하고 인페인팅하는 데 사용됩니다. 이해를 돕기 위해 간단한 예시로 설명드리겠습니다:
- 자동 감지 및 인페인팅: ADetailer는 얼굴 인식 모델을 사용하여 이미지에서 얼굴을 감지하고 인페인트 마스크를 자동으로 생성합니다. 예를 들어, 이미지에서 얼굴이 흐릿하게 나온 경우, ADetailer는 해당 부분을 감지하여 선명하게 만드는 작업을 자동으로 수행합니다.
- 세부 사항 개선: ADetailer를 사용하면 이미지의 특정 부분(예: 얼굴, 손 등)의 세부 사항을 개선할 수 있습니다. 이는 이미지 전체의 품질을 향상시키는 데 도움이 됩니다.
- 사용자 정의 인페인팅: ADetailer를 통해 사용자는 인페인팅 과정에서 세부 사항을 조절할 수 있습니다. 예를 들어, 얼굴의 특정 부분만을 선명하게 하거나, 이미지의 특정 색상을 조절하는 등의 작업을 수행할 수 있습니다.
- 다양한 모드에서의 사용: ADetailer는 txt2img 및 img2img 모드에서 사용할 수 있어, 이미지 복원 및 개선 작업을 다양하게 수행할 수 있습니다. 예를 들어, 이미지에 얼굴이 포함된 경우 txt2img 모드를 사용하여 얼교를 더 선명하게 만들 수 있습니다.
ADetailer는 Stable Diffusion을 사용하여 이미지를 생성하고 개선하는 과정에서 유용한 도구로, 특히 세부 사항을 중점적으로 다루어야 할 때 그 가치를 발휘합니다
'AI' 카테고리의 다른 글
LoRA 훈련 필수 가이드 완벽정리 (2) | 2024.02.17 |
---|