본문 바로가기
AI

스테이블 디퓨젼 용어정리

by 포커서 2024. 2. 17.
728x90

체크포인트 (Checkpoint)

역할: 모델의 메인 모듈로, 선택한 모델에 따라 생성되는 이미지의 전체적인 스타일이 결정됩니다.

VAE (Variational Autoencoder)

역할: 데이터 분포의 잠재 공간을 학습하여 이미지의 품질을 보정하는 역할을 합니다.

Lora (Low-Rank Adaptation)

역할: 추가 학습 기법인 드림부스를 기반으로 하여 모델에 새로운 피사체를 학습시키는 역할을 하며, 이미지 생성에 큰 영향을 줍니다.

임베딩 (Embedding)

역할: 모델에 직접적인 영향을 주지 않으면서 프롬프트를 추가 학습하는 방법으로, 특정한 특징을 모델에 추가합니다.

하이퍼 네트워크 (Hyper Network)

역할: 임베딩과 유사하지만 더 큰 영향력을 가지고 모델에 '공부'를 시키는 역할을 합니다.

프롬프트 (Prompt)

역할: 이미지 생성의 핵심 코드로, 사용자가 원하는 그림을 그리도록 AI에게 지시하는 문장이나 단어들의 집합입니다.

네거티브 프롬프트 (Negative Prompt)

역할: 이미지에서 제외하고 싶은 요소를 지정하는 데 사용되는 프롬프트입니다.

가중치

역할: 프롬프트 내 특정 키워드의 영향도를 조절합니다. 기본값은 1이며, 가중치 값을 조정하여 영향력을 조절할 수 있습니다.

태그형/문장형 프롬프트

역할: 이미지의 외모, 상태, 배경 등의 요소를 지정하는 태그형 프롬프트와 구도, 상황, 행위를 묘사하는 문장형 프롬프트로 구분됩니다.

샘플링 방법 (Sampling Method)

역할: 이미지 생성 시 선택하는 알고리즘의 종류를 의미합니다. 여기서 'DPM++ 2M Karras'는 특정한 딥러닝 샘플링 방법을 지칭합니다.

하이레스.픽스 (Hires. fix)

역할: 고해상도 이미지 생성 시 특정 문제를 해결하기 위한 설정입니다.

업스케일러 (Upscaler)

역할: 이미지의 해상도를 높이는 기능입니다. 'Latent'는 업스케일링 방식 중 하나를 지칭하며, 이는 이미지의 잠재 공간을 활용한 업스케일링을 의미합니다.

업스케일 바이 (Upscale by)

역할: 기본 이미지 크기에 비례하여 몇 배로 업스케일 할지 결정하는 설정값입니다.

하이레스 스텝스 (Hires steps)

역할: 고해상도 생성 시 반복적으로 진행될 스텝의 수를 설정합니다.

Inpaint Denoising Strength (인페인트 노이즈 제거 강도)

이 설정은 이미지를 수정할 때 얼마나 많은 변화를 주고 싶은지 결정합니다. 예를 들어, 값이 0이면 원본 이미지와 똑같이 유지하고, 1이면 완전히 새로운 이미지로 변환합니다. 예시: 사진 속 얼굴에 작은 주름을 없애고 싶다면 낮은 값(예: 0.2)을 사용하고, 얼굴을 완전히 다른 사람의 얼굴로 바꾸고 싶다면 높은 값(예: 0.8)을 사용합니다.

Inpaint Respective Field (인페인트 관련 필드)

이 설정은 이미지의 어느 부분을 수정할지 결정합니다. 다양한 옵션을 통해 원하는 부분을 더 자세하게 선택할 수 있습니다. 예시: 원본 이미지의 일부만 바꾸고 싶다면 'Original' 옵션을 사용하고, 이미지의 특정 부분을 완전히 새롭게 만들고 싶다면 'Latent Noise'를 사용합니다.

Mask Erode or Dilate (마스크 침식 또는 팽창)

이 설정은 이미지 수정시 마스크(수정할 부분)의 크기를 조절합니다. 양수 값은 마스크를 확장하고, 음수 값은 축소합니다. 예시: 얼굴의 일부를 수정하려면, 마스크를 해당 부분에 맞추고 양수 값으로 조정하여 마스크 크기를 살짝 늘릴 수 있습니다. 이렇게 하면 수정할 부분이 더 정확하게 선택됩니다.

리파이너 (Refiner)

역할: 이미지의 세부사항을 개선하기 위한 추가적인 처리 과정을 의미합니다.

너비 (Width), 높이 (Height)

역할: 생성할 이미지의 해상도를 결정합니다.

CFG (Guidance Scale)

Stable Diffusion의 Guidance Scale, 또는 CFG Scale은 AI가 이미지를 생성할 때 텍스트 프롬프트(지시문)를 얼마나 정확하게 따를지 결정하는 설정입니다. 간단히 말해서, 이 값이 높으면 AI는 프롬프트를 더 엄격하게 따르고, 낮으면 더 자유롭게 이미지를 생성합니다.

예를 들어:

낮은 CFG 값 (예: 1): AI는 프롬프트를 거의 무시하고 상당히 자유롭게 이미지를 생성합니다. 예를 들어, "노란색 꽃"이라는 프롬프트에 대해 AI는 노란색이 거의 없는 다양한 색의 꽃을 생성할 수 있습니다. 중간 CFG 값 (예: 7-9): AI는 프롬프트를 적당히 따르면서도 일정한 창의성을 유지합니다. "노란색 꽃"에 대해, AI는 주로 노란색 꽃을 생성하지만, 다른 색상의 요소나 독창적인 형태를 추가할 수도 있습니다. 높은 CFG 값 (예: 15 이상): AI는 프롬프트를 매우 엄격하게 따릅니다. 이 경우, "노란색 꽃"에 대해 AI는 거의 노란색만을 사용하여 정확한 꽃의 이미지를 생성할 것입니다.

시드 (Seed)

역할: 무작위성을 제어하여, 동일한 시드 값으로 동일한 이미지를 재생성할 수 있습니다.

스크립트 (Script)

역할: 이미지 생성 프로세스에 추가적인 스크립트를 적용할 수 있습니다.

샘플링 스텝스 (Sampling Steps)

역할: 이미지 생성 과정에서 모델이 반복하는 횟수를 지정합니다. 숫자가 높을수록 더 많은 계산을 거쳐 이미지를 생성하게 되며, 일반적으로 이미지 품질이 더 세밀해질 수 있습니다.

배치 카운트 (Batch Count)

역할: 한 번에 생성할 이미지의 배치(그룹) 수를 지정합니다. 예를 들어, 배치 카운트를 3으로 설정하면, 한 번의 요청으로 3개의 이미지가 생성됩니다.

배치 사이즈 (Batch Size)

역할: 각 배치 내에 포함될 이미지의 수를 지정합니다. 배치 사이즈를 높이면 동시에 더 많은 이미지를 생성할 수 있지만, 이는 시스템의 자원을 더 많이 소모하게 됩니다.

리사이즈 너비/높이 (Resize Width to / Resize Height to)

역할: 생성된 이미지를 특정한 너비나 높이로 조정합니다. 이는 이미지의 최종 해상도를 사용자가 원하는 크기로 맞출 때 사용됩니다.

노이즈 스케일 (Noise Scale)

역할: 생성 과정에서 이미지에 추가되는 노이즈의 양을 조절합니다. 더 높은 수치는 이미지에 더 많은 무작위성을 부여합니다.

초기 이미지 (Initial Image)

역할: 이미지 생성 시 시작점으로 사용될 기존 이미지를 지정합니다. 이를 통해 특정 이미지를 기반으로 새로운 이미지를 변형하거나 개선할 수 있습니다.

마스크 (Mask)

역할: 이미지의 특정 영역만을 수정하거나 변형하고 싶을 때 사용합니다. 마스크를 적용하면 해당 영역만 선택적으로 변형할 수 있습니다.

조건부 생성 (Conditional Generation)

역할: 특정 조건을 만족하는 이미지만을 생성하도록 모델을 조건화하는 기능입니다.

Inpainting

역할: 이미지의 특정 부분이 손상되었거나 제거되어야 할 때, 해당 부분을 자연스럽게 복원하거나 채우는 작업을 수행합니다.

Outpainting

역할: 주어진 이미지의 경계를 넘어서 확장하여 더 큰 이미지를 생성하는 기능입니다.

이미지 변환 (Image Transform)

역할: 이미지의 크기, 회전, 반전 등의 변형을 적용할 수 있습니다.

색상 조절 (Color Adjustment)

역할: 이미지의 색상, 채도, 명도 등을 조절하여 다른 느낌을 줄 수 있습니다.

알파 채널 (Alpha Channel)

역할: 이미지의 투명도를 조절할 수 있는 설정으로, 배경 제거나 오버레이 효과에 사용됩니다.

이미지 합성 (Image Composition)

역할: 두 개 이상의 이미지를 합쳐서 하나의 새로운 이미지를 생성하는 기능입니다.

텍스처 합성 (Texture Synthesis)

역할: 주어진 텍스처를 바탕으로, 그 패턴을 따라 이미지 전체에 적용하는 기능입니다.

스타일 전이 (Style Transfer)

역할: 한 이미지의 스타일을 다른 이미지에 적용하여 새로운 스타일을 생성합니다.

슈퍼 리졸루션 (Super Resolution)

역할: AI를 사용하여 이미지의 해상도를 극적으로 향상시키는 기술입니다. 이는 종종 이미지를 확대할 때 디테일을 유지하거나 복원하는 데 사용됩니다.

모델 인터폴레이션 (Model Interpolation)

역할: 두 개의 다른 훈련된 모델 사이의 중간점을 찾아서, 두 모델의 특성을 혼합한 새로운 이미지를 생성합니다.

스타일 믹싱 (Style Mixing)

역할: 여러 스타일의 특징을 조합하여, 하나의 이미지에 다양한 스타일을 적용하는 기술입니다.

특징 보강 (Feature Augmentation)

역할: 생성된 이미지에 추가적인 특징이나 속성을 부여하는 기능으로, 이미지의 복잡성과 표현력을 높입니다.

다중 프롬프트 조화 (Multi-Prompt Harmony)

역할: 여러 프롬프트를 조합하여 이미지 생성 시 동시에 반영함으로써, 복합적인 요구사항을 만족시키는 이미지를 생성합니다.

세대별 이미지 진화 (Generational Image Evolution)

역할: 이미지를 반복적으로 생성하고, 각 세대마다 변형을 가하여 점진적으로 결과를 개선하는 기술입니다.

심층 메타데이터 통합 (Deep Metadata Integration)

역할: 이미지와 함께 생성되는 메타데이터를 활용하여, 이미지의 생성 과정이나 특성을 더욱 풍부하게 만드는 기능입니다.

점진적 세밀화 (Progressive Refinement)

역할: 이미지를 점진적으로 세밀하게 만드는 과정을 통해, 최종 결과물의 품질을 향상시킵니다.

Stable Diffusion의 Guidance Scale, 또는 CFG Scale은 AI가 이미지를 생성할 때 텍스트 프롬프트(지시문)를 얼마나 정확하게 따를지 결정하는 설정입니다. 간단히 말해서, 이 값이 높으면 AI는 프롬프트를 더 엄격하게 따르고, 낮으면 더 자유롭게 이미지를 생성합니다.

예를 들어:

낮은 CFG 값 (예: 1): AI는 프롬프트를 거의 무시하고 상당히 자유롭게 이미지를 생성합니다. 예를 들어, "노란색 꽃"이라는 프롬프트에 대해 AI는 노란색이 거의 없는 다양한 색의 꽃을 생성할 수 있습니다. 중간 CFG 값 (예: 7-9): AI는 프롬프트를 적당히 따르면서도 일정한 창의성을 유지합니다. "노란색 꽃"에 대해, AI는 주로 노란색 꽃을 생성하지만, 다른 색상의 요소나 독창적인 형태를 추가할 수도 있습니다. 높은 CFG 값 (예: 15 이상): AI는 프롬프트를 매우 엄격하게 따릅니다. 이 경우, "노란색 꽃"에 대해 AI는 거의 노란색만을 사용하여 정확한 꽃의 이미지를 생성할 것입니다.

 

Adetailor

ADetailer는 Stable Diffusion의 확장 기능으로, 이미지의 특정 부분을 자동으로 감지하고 인페인팅하는 데 사용됩니다. 이해를 돕기 위해 간단한 예시로 설명드리겠습니다:

  1. 자동 감지 및 인페인팅: ADetailer는 얼굴 인식 모델을 사용하여 이미지에서 얼굴을 감지하고 인페인트 마스크를 자동으로 생성합니다. 예를 들어, 이미지에서 얼굴이 흐릿하게 나온 경우, ADetailer는 해당 부분을 감지하여 선명하게 만드는 작업을 자동으로 수행합니다.
  2. 세부 사항 개선: ADetailer를 사용하면 이미지의 특정 부분(예: 얼굴, 손 등)의 세부 사항을 개선할 수 있습니다. 이는 이미지 전체의 품질을 향상시키는 데 도움이 됩니다.
  3. 사용자 정의 인페인팅: ADetailer를 통해 사용자는 인페인팅 과정에서 세부 사항을 조절할 수 있습니다. 예를 들어, 얼굴의 특정 부분만을 선명하게 하거나, 이미지의 특정 색상을 조절하는 등의 작업을 수행할 수 있습니다.
  4. 다양한 모드에서의 사용: ADetailer는 txt2img 및 img2img 모드에서 사용할 수 있어, 이미지 복원 및 개선 작업을 다양하게 수행할 수 있습니다. 예를 들어, 이미지에 얼굴이 포함된 경우 txt2img 모드를 사용하여 얼교를 더 선명하게 만들 수 있습니다.

ADetailer는 Stable Diffusion을 사용하여 이미지를 생성하고 개선하는 과정에서 유용한 도구로, 특히 세부 사항을 중점적으로 다루어야 할 때 그 가치를 발휘합니다

'AI' 카테고리의 다른 글

LoRA 훈련 필수 가이드 완벽정리  (2) 2024.02.17