내 PC에서 AI 모델 돌려보기 — 로컬 LLM 입문기

로컬 LLM이 뭔데?

ChatGPT나 Claude 같은 AI는 인터넷으로 서버에 접속해서 쓰는 방식입니다. 반면 로컬 LLM은 내 컴퓨터에 AI 모델을 직접 설치해서 실행하는 겁니다.

인터넷 없이도 되고, 내 데이터가 외부로 나가지 않아서 보안이 좋습니다.

회사에서 쓸 때 보안 이슈로 ChatGPT에 코드를 못 넣는 경우가 있었습니다. 그래서 로컬에서 돌릴 수 있는 방법을 찾다가 시작했습니다.

여러 방법이 있는데, 제일 쉬운 건 Ollama입니다. 설치도 간단하고 명령어 몇 줄이면 바로 AI랑 대화할 수 있습니다.

설치 후 터미널에서 이렇게 치면 끝입니다:

ollama run llama3

이러면 Meta의 Llama 3 모델이 다운로드되고 바로 대화할 수 있습니다.

제가 써본 것들 중 추천:

한국어를 주로 쓴다면 Qwen 시리즈가 그나마 낫습니다. 영어는 어떤 모델이든 꽤 잘 합니다.

VRAM이 핵심이라, 본인 GPU의 VRAM이 얼마인지 먼저 확인해보세요.

로컬 LLM은 만능은 아니지만, 특정 상황에서는 클라우드 AI보다 나은 선택입니다. 특히 보안이 중요하거나 인터넷이 불안정한 환경에서 유용합니다.

한 번 설치해놓으면 이것저것 실험해보는 재미가 있으니, 관심 있으시면 Ollama부터 시작해보세요.