안녕하세요! 설 연휴 잘 보내고 계시나요? 🙂
설 연휴 동안 엄청난 핫 이슈, DeepSeek R1의 등장으로 꽤나 시끌시끌했는데요, 그 내용을 바탕으로 제가 알기 쉽게 정리해봤습니다!
DeepSeek란? 새로운 AI 모델의 등장
AI 챗봇 하면 가장 먼저 떠오르는 것은 아마도 OpenAI의 ChatGPT일 것입니다. 하지만 최근 DeepSeek이라는 새로운 AI 모델이 등장하며 많은 주목을 받고 있습니다. DeepSeek은 ChatGPT와 마찬가지로 대화를 할 수 있는 AI이지만, 학습 방식과 활용 방식에서 차이를 보입니다.
DeepSeek이 화제가 된 이유 중 하나는 미국의 대중국 AI 제재에도 불구하고 높은 성능을 보여주었다는 점입니다. 미국은 AI 러닝에 필수적인 엔비디아(NVIDIA) GPU의 중국 수출을 제한했음에도 불구하고, 이를 극복하며 DeepSeek AI 모델을 탄생시켰습니다. DeepSeek 발표된 후, "AI 모델을 학습하는 데 엔비디아의 칩셋이 반드시 필요하지 않을 수도 있다."는 논의가 이어졌고(사실 엔비디아의 CUDA로 효율적이게 개발을 하는 것이지 아예 개발을 못하는건 아닙니다.), 실제로 이 소식이 전해진 후 엔비디아의 주가가 급락하는 일까지 벌어졌습니다.(현재에는 엔비디아 칩셋을 쓰고있다. 가 정설입니다.)
그렇다면, 이런 환경에서도 DeepSeek은 어떻게 학습되었을까요?
1. DeepSeek과 ChatGPT의 학습 방식 차이
DeepSeek과 ChatGPT는 모두 대화형 AI이지만, 학습 방식에서 큰 차이가 있습니다.
🔹 ChatGPT: 지도 학습 + 강화 학습 (RLHF)
ChatGPT는 지도 학습(Supervised Learning)과 강화 학습(RLHF, Reinforcement Learning from Human Feedback)을 결합한 방식으로 학습됩니다. 쉽게 이해할 수 있도록 예를 들어보겠습니다.
✅ 한국의 수도는? → 서울입니다. (정답) → 학습 완료
❌ 한국의 수도는? → 워싱턴입니다. (오답) → 수정 및 재학습
즉, ChatGPT는 기존 데이터 학습 + 인간의 피드백을 통한 수정 과정을 반복하며 답변의 정확도를 높여갑니다.
🔹 DeepSeek: 순수 강화 학습 (RL)
반면 DeepSeek은 순수한 강화 학습 방식을 채택합니다. 예를 들어, AI에게 다음과 같은 수학 문제를 주었다고 가정해 봅시다.
3x^2 + 100 = 127일 때, x는 얼마인가?
DeepSeek은 처음에는 무작위로 답변을 내놓습니다. 하지만 정답인 x = 3을 도출할 때 보상을 주는 방식을 통해, 시행착오를 거치면서 점점 더 정확한 답을 찾게 됩니다. 즉, DeepSeek은 스스로 문제 해결 능력을 발전시키는 AI 모델이라고 할 수 있습니다.
이 방식은 특히 논리적 사고와 문제 해결 능력을 요구하는 작업에서 강력한 성능을 발휘할 가능성이 있습니다.
2. DeepSeek의 강점
✅ 1) 오픈 소스 기반의 자유로운 활용 (MIT 라이선스)
DeepSeek은 MIT 라이선스로 제공되며, 누구나 무료로 사용할 수 있습니다. MIT 라이선스는 가장 자유로운 오픈 소스 라이선스 중 하나로, 사용자가 코드를 수정하고, 재배포하며, 상업적 목적으로도 활용할 수 있도록 허용합니다. 반면 ChatGPT는 OpenAI의 관리 하에 제한적으로 무료가 되며, 대부분 유료로 서비스가 제공됩니다.
오픈 소스 기반인 DeepSeek은 기업과 개발자들이 자신의 필요에 맞게 AI 모델을 커스터마이징할 수 있다는 점에서 큰 장점이 됩니다.
✅ 2) 저렴한 추론 비용
DeepSeek은 추론 비용(Inference Cost) 측면에서도 큰 강점을 가지고 있습니다. ChatGPT API와 비교했을 때 DeepSeek API의 비용이 훨씬 저렴하며, 대량의 요청을 처리하는 기업과 개발자들에게 유리한 선택지가 됩니다.
ChatGPT API 비용 예시:
- GPT-4 (입력): $0.03 / 1,000 tokens
- GPT-4 (출력): $0.06 / 1,000 tokens
- 500단어 (750 tokens) 응답 시 비용: $0.0675 / 응답
- 100M (1억) 토큰 사용 시: $9,000 / 월
DeepSeek API 비용 예시 (예측치):
- 입력: $0.01 / 1,000 tokens
- 출력: $0.01 / 1,000 tokens
- 500단어 (750 tokens) 응답 시 비용: $0.015 / 응답
- 100M (1억) 토큰 사용 시: $2,000 / 월
이러한 차이로 인해 DeepSeek을 사용하면 연간 최대 $84,000 이상을 절약할 수 있습니다. 특히 오픈 소스로 제공되기 때문에 자체 서버에 배포하면 API 비용 자체를 없애고 추론비용만 발생할 수 있습니다.
DeepSeek은 저렴한 비용과 오픈 소스 라이선스를 통한 자유로운 활용이 가능하다는 점에서, AI 모델을 활용하려는 기업과 개발자들에게 매우 매력적인 선택이 될 수 있습니다.
3. DeepSeek의 활용 방안
DeepSeek은 MIT 라이선스를 기반으로 무료로 사용할 수 있기 때문에, 다양한 시스템에 적용할 수 있습니다. 예를 들어:
- 자체 AI 시스템 구축 → DeepSeek의 오픈 소스 모델을 활용해 기업이나 연구 기관에서 맞춤형 AI 시스템을 개발할 수 있음.
- 회사 내부 로컬 서버에 설치하여 운영 → DeepSeek을 자체 서버에 배포하여 맞춤형 AI를 튜닝하고 사용할 수 있음.
- 성능 테스트 후 다양한 곳에 활용 가능 → AI의 성능을 비교 분석하고, 특정 작업에 대한 최적의 활용 방안을 찾는 데 도움.
DeepSeek은 아직 발전 중인 모델이지만, 강화 학습 기반의 접근 방식과 오픈 소스 라이선스 덕분에 앞으로 다양한 활용이 가능할 것으로 보입니다.
로컬에서 DeepSeek 실행해보기.
아래 내용은 m1 macbook air 에서 실제로 로컬에서 Ollama를 이용하여 실행을 한 결과입니다.
https://ollama.com/library/deepseek-r1:7b
위 링크에서 공개된 Deepseek의 모델을 로컬환경에서 사용할 수 있습니다.
플러터에 대해서 물어봤을 때 70b(42GB)는 추론이 되지 않았으며(스펙미달로 추정), 14b(9.0GB)는 추론이 가능하였습니다. 아래 영상은 추론 결과입니다.
참고링크
- Teachfloor – DeepSeek vs ChatGPT 비교
- DeepSeek과 ChatGPT의 기술적 차이, 성능 및 윤리적 측면 비교
- Creole Studios – DeepSeek vs ChatGPT 비용 비교
- DeepSeek과 ChatGPT의 API 비용 비교 및 확장성 분석
- https://github.com/deepseek-ai/DeepSeek-R1
'Study > 기타' 카테고리의 다른 글
RAG 기반 AI 서버 구축: 기초지식 다지기 (2) | 2025.02.01 |
---|---|
App 개발자의 우당탕탕 AI서버 만들기 (1) | 2025.02.01 |
Flutter의 Clean Architecture 클린아키텍처, 각 Layer에 대하여 (0) | 2024.06.20 |
Clean Architecture 클린아키텍처, 객체지향 디자인 5원칙 SOLID[5부] (1) | 2024.03.23 |
Clean Architecture 클린아키텍처, 객체와객체지향 프로그래밍[4부] (0) | 2024.03.20 |