카자흐스탄은 ChatGPT와 유사한 자체 신경망을 개발 중이다. 이에 대해 디지털 정부 지원 센터의 루스템 비가리 센터장이 브리핑했다며 Kazinform 통신원이 보도했다.
디지털 정부 지원 센터의 센터장은 현재 인기있는 ChatGPT에 현재 정확하게 카자흐어로 텍스트를 생성하고 답변할 수 없음을 지적했다.
“ChatGPT가 정확하게 카자흐어로 답하고 말을 하기 위해서는 130억의 토큰이 필요합니다. 현재 ChatGPT에는 15억의 토큰만 보유하고 있고 이는 10배나 적은 수치입니다. 왜 그런것일까요? 왜냐하면 전 세계적으로 사용되는 공개 데이터가 많기 때문입니다. 그렇기 때문에 현재 우리의 가장 큰 과제는 카자흐 정신, 작품 등을 고려해 우리의 국내 버전을 만드는 것입니다.”라고 루스템 비가리 센터장은 말했다.
그의 설명에 따르면, 국내 모델 ChatGPT는 올해 말 카자흐스탄 국민들에게 제공될 것이라고 한다. 카자흐스탄 디지털 개발, 혁신, 우주항공산업부는 사업자와 개발자에 지원을 하고 있다. 카자흐스탄 ChatGPT를 만들기 위해 필요한 비용에 대해서는 언급하지 않았다.
“현재 예산이 편성되고 있습니다. 지금은 그 수치를 말할 수 없습니다. 언어 모델은 여러 단계를 거쳐 생성되기 때문입니다. 데이터를 수집하는 것 뿐만 아니라 모든 것을 올바르게 표시해야 하는 언어학자에게는 많은 작업이 필요합니다. 언어 표기 개발에는 많은 시민들이 참여할 계획입니다. 예를 들어, 한국은 자체 언어 모델을 개발하기 위해 수십억을 시민들에 지출하고 있습니다. 우리와 이와 유사한 방식으로 지출될 것입니다.”라고 디지털 정부 지원 센터의 센터장이 언급했다.
/카즈인폼