AI가 그림을 그린다고?
텍스트를 입력하면 AI가 이미지를 만들어준다는 건 알고 있었는데, 직접 해본 건 얼마 전이 처음입니다. 미드저니, DALL-E 같은 서비스도 있지만, 제 PC에서 직접 돌릴 수 있는 Stable Diffusion을 선택했습니다.
왜 Stable Diffusion인가
- 무료 — 오픈소스라 돈이 안 듦
- 로컬 실행 — 내 PC에서 돌리니까 횟수 제한 없음
- 커스텀 자유도 — 모델, 설정을 마음대로 바꿀 수 있음
대신 GPU가 필요하고 초기 설정이 좀 있습니다.
설치 과정
WebUI라는 걸 설치하면 브라우저에서 편하게 쓸 수 있습니다. 설치 자체는 GitHub에서 클론 받고 실행하면 되는데, 처음이라 의존성 에러를 몇 번 만났습니다.
Python 버전이 안 맞아서 한 번, CUDA 버전이 안 맞아서 한 번. 이런 삽질을 거치면 결국 됩니다. 한 시간 정도 걸렸던 것 같습니다.
처음 생성해본 이미지
프롬프트에 “a cozy cafe in a rainy city, warm lighting, illustration style"을 넣어봤습니다.
30초 정도 기다리니까 진짜 그럴듯한 카페 일러스트가 나왔습니다. 솔직히 감동받았습니다. 이걸 내 PC에서 만들었다는 게 신기했어요.
프롬프트가 핵심이다
같은 주제라도 프롬프트를 어떻게 쓰느냐에 따라 결과가 완전히 다릅니다.
안 좋은 프롬프트
고양이
→ 뭔가 나오긴 하는데 원하는 느낌이 아님
좋은 프롬프트
a fluffy orange cat sitting on a windowsill,
afternoon sunlight, bokeh background,
photorealistic, detailed fur, 8k
→ 훨씬 정교한 결과
영어로 쓰는 게 결과가 좋고, 구체적으로 묘사할수록 원하는 이미지에 가까워집니다.
생각보다 GPU를 많이 쓴다
512x512 해상도는 RTX 3060에서도 잘 되는데, 1024x1024로 올리면 VRAM이 빡빡해집니다. 고해상도 이미지를 뽑으려면 GPU가 좋아야 합니다.
생성 시간도 해상도에 따라 크게 달라집니다. 512x512는 10~20초, 1024x1024는 1분 이상 걸리기도 합니다.
쓸 만한 곳
- 블로그 썸네일 — 저작권 걱정 없는 이미지
- 프레젠테이션 — 발표자료에 넣을 일러스트
- SNS 콘텐츠 — 인스타 피드용 이미지
- 아이디어 시각화 — 머릿속 이미지를 빠르게 구현
한계도 있다
- 손가락 — AI가 아직 손을 잘 못 그립니다. 6개인 경우가 많음
- 텍스트 — 이미지 안에 글자 넣으면 깨짐
- 특정 인물 — 유명인 얼굴을 정확히 만들기는 어려움
- 일관성 — 같은 캐릭터를 여러 장 만들 때 매번 다르게 나옴
마치며
Stable Diffusion은 한 번 세팅해놓으면 무료로 무제한 이미지를 만들 수 있어서 가성비가 좋습니다. 초기 설치가 좀 귀찮지만, 그 과정 자체도 공부가 됩니다.
그림 실력이 없어도 원하는 이미지를 만들 수 있다는 게 AI 시대의 장점이라고 생각합니다. 관심 있으시면 한 번 도전해보세요.