딥시크 'R2' 공개 관련 'R1' 답변


지난 1월 저비용 고효율 AI 모델인 'R1'를 내놓은 중국 스타트업 딥시크(DeepSeek)가 업그레이드 모델인 R2를 조만간 공개할 것으로 전해졌습니다.

중국 IT 매체인 콰이커지는 어제(12일) 딥시크가 R2 모델을 오는 15일부터 30일 사이에 발표할 것이라고 보도했습니다.

이와 관련해 딥시크 측은 정확한 발표 일자는 추후 공지하겠다고 밝혀 시장에서는 딥시크가 조만간 R2를 발표할 것으로 전망하고 있습니다.

딥시크 측에 따르면 R2는 더욱 진보된 혼합 전문가 모델(MoE, Mixture of Experts)을 채택했고, 총 매개변수를 1조 2천억 개로 기존 대비 2배 늘려 고부하 추론 작업의 성능을 최적화한 것으로 알려졌습니다.

특히 R2는 화웨이가 자체 개발한 그래픽처리장치 '어센드 910B'를 기반으로 훈련되면서 R2의 훈련 비용이 GPT4에 비해 97% 감소할 것으로 전문가들은 예상했습니다.

화웨이의 연구실 측은 화웨이 어센드 910B를 여러 개 묶어서 만든 초고성능 칩이 사용돼 성능이 엔비디아 'A100' 훈련 클러스터의 약 91%에 해당한다고 설명했습니다.

이로 인해 '딥시크 R2'의 사용료는 오픈AI의 GTP-4o제품보다 낮고, 기존 AI 서비스의 가격 모델을 뒤엎어 놓을 것이란 관측이 나오고 있습니다.



배삼진 특파원(baesj@yna.co.kr)

연합뉴스TV 기사문의 및 제보 : 카톡/라인 jebo23

배삼진(baesj@yna.co.kr)

당신이 담은 순간이 뉴스입니다!

ⓒ연합뉴스TV, 무단 전재-재배포, AI 학습 및 활용 금지

  • 좋아요

    0
  • 응원해요

    0
  • 후속 원해요

    0

ADVERTISEMENT