AI 대기업, 더 작은 모델로 효율성 추구
대형 기술 회사들과 스타트업들은 이제 더 작고 효율적인 AI 모델 개발에 집중하고 있습니다 WSJ 에 따르면. 초기에는 OpenAI의 GPT-4처럼 수조 개의 파라미터를 사용하고 제작 비용이 1억 달러가 넘는 거대한 모델을 만드는 것이 목표였습니다. 하지만 이제는 더 작고 저렴한 모델을 개발하려고 노력하고 있습니다.
마이크로소프트는 소형 모델인 Phi 패밀리를 제공하며, 이는 오픈AI의 ChatGPT에서 사용하는 무료 모델의 1/100 크기에 불과합니다. 이러한 모델은 훈련 및 운영 비용이 적게 들지만 여전히 우수한 성능을 발휘합니다.
작은 AI 모델은 제한된 데이터를 사용하며 특정 작업을 위해 설계되었습니다.
- 경제적 효율성
- 빠른 응답 속도
- 전문성
마이크로소프트의 최고 상업 책임자 유수프 메디는 대규모 AI 모델 운영이 시간이 지남에 따라 유지 비용이 너무 많이 들 것이라고 언급했습니다.
작은 모델은 기기에서 실행될 수 있어, 비싼 클라우드 슈퍼컴퓨터가 필요하지 않습니다. 애플은 휴대폰에 AI를 적용하여 더 빠르고 안전하게 만들고자 합니다. 다른 기술 회사들도 같은 방향으로 나아가고 있습니다.
비용과 성능 혜택
마이크로소프트는 처음에 생성 AI에 막대한 투자를 했지만, 대형 모델이 예상보다 비용이 많이 든다는 것을 알게 되었습니다. Phi와 같은 소형 모델은 적은 데이터와 컴퓨팅 파워를 필요로 하여 비용이 절감됩니다. 올해 구글과 Mistral, Anthropic, Cohere와 같은 스타트업들도 소형 모델을 출시했습니다.
작은 모델을 활용하면 비용을 크게 절감할 수 있습니다. AI21 Labs의 공동 창립자 요아브 쇼함은 이 작은 모델이 더 큰 모델에 비해 비용을 6분의 1로 줄일 수 있다고 말했습니다. 이러한 작은 모델은 법률 문서나 내부 커뮤니케이션과 같은 특정 데이터 세트에 맞춤화하여 거의 동일한 품질을 제공하면서도 낮은 비용으로 효과적으로 작동합니다.
작은 모델에 대한 주요 사항:
- 데이터 사용량이 적음
- 훈련 비용 절감
- 특정 작업에 효율적
Experian은 인공지능 챗봇을 대규모 모델에서 소규모 모델로 변경했습니다. 데이터 책임자인 알리 칸은 소규모 모델이 대규모 모델과 마찬가지로 잘 작동하고 비용 절감에도 효과적이라고 밝혔습니다. 또한 이러한 소규모 모델은 오답을 줄여 더 효율적이라고 말했습니다.
현재의 경향은 미래를 결정짓고 있습니다.
대형 AI 모델의 발전 속도가 둔화되면서 소형 모델이 개선될 기회를 얻고 있습니다. OpenAI가 GPT-4를 출시한 이후 대형 모델에서는 큰 진전이 없었습니다. 이 둔화의 원인은 훈련에 필요한 새로운 고품질 데이터의 부족입니다.
현재 마이크로소프트는 AI의 효율성을 향상시키는 데 주력하고 있습니다. 마이크로소프트의 Phi 모델 프로젝트를 이끌고 있는 세바스티앙 뷔벡은 지금 효율성에 초점을 맞추는 것이 중요하다고 말했습니다.
요약하자면,
대형 모델의 발전 속도가 느려지고, 효율성 향상에 대한 관심이 증가하고 있습니다. 또한, 특정 작업을 잘 수행하는 소형 모델들이 주목받고 있습니다.
기업들이 새로운 방향으로 나아가고 있지만, 여전히 대규모 모델을 사용하고 있습니다. 애플과 마이크로소프트는 자사 제품에 오픈AI의 기술을 추가하고 있지만, 이는 이들이 AI 분야에서 제공하는 것의 일부에 불과합니다. 애플은 최근 발표에서 AI 업데이트에 대해 간단히 언급하기도 했습니다.
작고 전문화된 AI 모델로의 전환은 큰 성과를 자랑하기보다는 기업에 실용적이고 경제적으로 활용할 수 있는 방향으로의 변화입니다. 이제는 AI를 실제 환경에서 쉽게 접근하고 효율적으로 사용할 수 있는 데 중점을 두고 있습니다.
2024년 11월 20일 · 오후 12:56
촉감의 혁신: AI와 양자기술로 표면 감지의 새로운 시대 열다
2024년 11월 19일 · 오후 8:02
모바일 친화적 AI: CALDERA로 대형 언어 모델을 가볍게 압축하기
2024년 11월 16일 · 오후 12:49
자율주행차 신뢰 혁신: 광주 팀의 설명 가능한 AI 연구 및 중요 전략 공개
이 기사 공유