AI가 그림을 그린다고?

텍스트를 입력하면 AI가 이미지를 만들어준다는 건 알고 있었는데, 직접 해본 건 얼마 전이 처음입니다. 미드저니, DALL-E 같은 서비스도 있지만, 제 PC에서 직접 돌릴 수 있는 Stable Diffusion을 선택했습니다.

왜 Stable Diffusion인가

  • 무료 — 오픈소스라 돈이 안 듦
  • 로컬 실행 — 내 PC에서 돌리니까 횟수 제한 없음
  • 커스텀 자유도 — 모델, 설정을 마음대로 바꿀 수 있음

대신 GPU가 필요하고 초기 설정이 좀 있습니다.

설치 과정

WebUI라는 걸 설치하면 브라우저에서 편하게 쓸 수 있습니다. 설치 자체는 GitHub에서 클론 받고 실행하면 되는데, 처음이라 의존성 에러를 몇 번 만났습니다.

Python 버전이 안 맞아서 한 번, CUDA 버전이 안 맞아서 한 번. 이런 삽질을 거치면 결국 됩니다. 한 시간 정도 걸렸던 것 같습니다.

처음 생성해본 이미지

프롬프트에 “a cozy cafe in a rainy city, warm lighting, illustration style"을 넣어봤습니다.

30초 정도 기다리니까 진짜 그럴듯한 카페 일러스트가 나왔습니다. 솔직히 감동받았습니다. 이걸 내 PC에서 만들었다는 게 신기했어요.

프롬프트가 핵심이다

같은 주제라도 프롬프트를 어떻게 쓰느냐에 따라 결과가 완전히 다릅니다.

안 좋은 프롬프트

고양이

→ 뭔가 나오긴 하는데 원하는 느낌이 아님

좋은 프롬프트

a fluffy orange cat sitting on a windowsill,
afternoon sunlight, bokeh background,
photorealistic, detailed fur, 8k

→ 훨씬 정교한 결과

영어로 쓰는 게 결과가 좋고, 구체적으로 묘사할수록 원하는 이미지에 가까워집니다.

생각보다 GPU를 많이 쓴다

512x512 해상도는 RTX 3060에서도 잘 되는데, 1024x1024로 올리면 VRAM이 빡빡해집니다. 고해상도 이미지를 뽑으려면 GPU가 좋아야 합니다.

생성 시간도 해상도에 따라 크게 달라집니다. 512x512는 10~20초, 1024x1024는 1분 이상 걸리기도 합니다.

쓸 만한 곳

  • 블로그 썸네일 — 저작권 걱정 없는 이미지
  • 프레젠테이션 — 발표자료에 넣을 일러스트
  • SNS 콘텐츠 — 인스타 피드용 이미지
  • 아이디어 시각화 — 머릿속 이미지를 빠르게 구현

한계도 있다

  • 손가락 — AI가 아직 손을 잘 못 그립니다. 6개인 경우가 많음
  • 텍스트 — 이미지 안에 글자 넣으면 깨짐
  • 특정 인물 — 유명인 얼굴을 정확히 만들기는 어려움
  • 일관성 — 같은 캐릭터를 여러 장 만들 때 매번 다르게 나옴

마치며

Stable Diffusion은 한 번 세팅해놓으면 무료로 무제한 이미지를 만들 수 있어서 가성비가 좋습니다. 초기 설치가 좀 귀찮지만, 그 과정 자체도 공부가 됩니다.

그림 실력이 없어도 원하는 이미지를 만들 수 있다는 게 AI 시대의 장점이라고 생각합니다. 관심 있으시면 한 번 도전해보세요.