Want to Become a Sponsor? Contact Us Now!🎉

LLM
Starling-7B: 강력한 오픈 소스 언어 모델

Starling-7B 소개: 강력한 오픈 소스 언어 모델

Published on

Starling-7B는 UC 버클리 연구원들이 AI 피드백에서 강화 학습을 사용하여 개발한 최첨단 오픈 소스 언어 모델입니다. 성능, 벤치마크 및 로컬 배포를 알아보세요.

Starling-7B는 캘리포니아 대학 버클리 캠퍼스의 연구자들에 의해 개발된 혁신적인 오픈 소스 대형 언어 모델(Large Language Model, LLM)입니다. 이 모델은 다양한 벤치마크에서 뛰어난 성능과 고급 언어 모델에 대한 접근성 확대의 잠재력으로 큰 관심을 받았습니다. 이 글에서는 Starling-7B의 개발, 성능 및 로컬 배포에 대해 자세히 알아보도록 하겠습니다.

최신 LLM 뉴스를 알고싶나요? 최신 LLM 리더보드를 확인해보세요!

Anakin AI - The Ultimate No-Code AI App Builder

개발과 훈련

Starling-7B는 강화 학습 기술인 "인공지능 피드백에 대한 강화학습(Reinforcement Learning from AI Feedback, RLAIF)"이라는 독특한 접근 방식을 사용하여 개발되었습니다. 모델은 "Nectar" 데이터셋을 사용하여 훈련되었는데, 이 데이터셋은 GPT-4에 의해 평가된 7개의 응답을 가진 183,000개의 채팅 프롬프트로 구성되어 있습니다. 연구자들은 GPT-4의 피드백을 활용하여 모델을 세밀하게 조정하여 고품질의 응답을 생성할 수 있었습니다.

Starling-7B의 기본 모델은 Openchat 3.5이며, 이 모델은 Mistral-7B 모델을 기반으로 합니다. 이러한 기반을 통해 연구자들은 기존 지식을 바탕으로 보다 능력있는 언어 모델을 구축할 수 있었습니다.

성능과 벤치마크

Starling-7B는 다양한 벤치마크에서 뛰어난 성능을 발휘하였습니다. 모델의 다양한 작업 능력을 측정하는 MT-Bench 벤치마크에서, Starling-7B는 GPT-4 스코어링을 사용하여 8.09의 점수를 달성하였습니다. 이 점수는 GPT-4와 GPT-4 Turbo를 제외한 모든 모델을 능가하여 모델의 탁월한 성능을 보여줍니다.

기본 Openchat 3.5 모델과 비교하면, Starling-7B는 MT-Bench 점수를 7.81에서 8.09로 향상시키고, AlpacaEval 점수도 88.51%에서 91.99%로 향상시켰습니다. 이러한 개선은 RLAIF 훈련 방법의 효과를 보여줍니다.

Starling-7B는 글쓰기, 인문학, 역할극, STEM 및 정보 추출 작업 등 다양한 영역에서 우수한 성과를 거두고 있습니다. 그러나 수학, 추론 및 코딩과 같은 영역에서는 GPT-4와 비교했을 때 아직 개선의 여지가 있습니다.


title: "Starling-7B: 강력한 오픈 소스 언어 모델" description: "Starling-7B는 UC 버클리 연구원들이 AI 피드백에서 강화 학습을 사용하여 개발한 최첨단 오픈 소스 언어 모델입니다. 성능, 벤치마크 및 로컬 배포를 알아보세요." date: 2024-04-30 language: ko author: jennie ogImage: https://raw.githubusercontent.com/lynn-mikami/Images/main/keyword.webp (opens in a new tab)

소개

Starling-7B는 캘리포니아 대학 버클리 캠퍼스의 연구자들에 의해 개발된 혁신적인 오픈 소스 대형 언어 모델(Large Language Model, LLM)입니다. 이 모델은 다양한 벤치마크에서 뛰어난 성능과 고급 언어 모델에 대한 접근성 확대의 잠재력으로 큰 관심을 받았습니다. 이 글에서는 Starling-7B의 개발, 성능 및 로컬 배포에 대해 자세히 알아보도록 하겠습니다.

개발과 훈련

Starling-7B는 강화 학습 기술인 "인공지능 피드백에 대한 강화학습(Reinforcement Learning from AI Feedback, RLAIF)"이라는 독특한 접근 방식을 사용하여 개발되었습니다. 모델은 "Nectar" 데이터셋을 사용하여 훈련되었는데, 이 데이터셋은 GPT-4에 의해 평가된 7개의 응답을 가진 183,000개의 채팅 프롬프트로 구성되어 있습니다. 연구자들은 GPT-4의 피드백을 활용하여 모델을 세밀하게 조정하여 고품질의 응답을 생성할 수 있었습니다.

Starling-7B의 기본 모델은 Openchat 3.5이며, 이 모델은 Mistral-7B 모델을 기반으로 합니다. 이러한 기반을 통해 연구자들은 기존 지식을 바탕으로 보다 능력있는 언어 모델을 구축할 수 있었습니다.

성능과 벤치마크

Starling-7B는 다양한 벤치마크에서 뛰어난 성능을 발휘하였습니다. 모델의 다양한 작업 능력을 측정하는 MT-Bench 벤치마크에서, Starling-7B는 GPT-4 스코어링을 사용하여 8.09의 점수를 달성하였습니다. 이 점수는 GPT-4와 GPT-4 Turbo를 제외한 모든 모델을 능가하여 모델의 탁월한 성능을 보여줍니다.

기본 Openchat 3.5 모델과 비교하면, Starling-7B는 MT-Bench 점수를 7.81에서 8.09로 향상시키고, AlpacaEval 점수도 88.51%에서 91.99%로 향상시켰습니다. 이러한 개선은 RLAIF 훈련 방법의 효과를 보여줍니다.

Starling-7B는 글쓰기, 인문학, 역할극, STEM 및 정보 추출 작업 등 다양한 영역에서 우수한 성과를 거두고 있습니다. 그러나 수학, 추론 및 코딩과 같은 영역에서는 GPT-4와 비교했을 때 아직 개선의 여지가 있습니다.

다른 모델들과의 비교

기타 오픈 소스 모델과 비교했을 때, Starling-7B는 뛰어난 성능을 보입니다. Zephyra-7B, Neural-Chat-7B 및 Tulu-2-DPO-70B와 같은 모델들을 다양한 벤치마크에서 앞섰습니다. Starling-7B의 성능은 GPT-4와 Claude-2에 근접하여 오픈 소스 LLM 분야에서 강력한 경쟁자로 인정받고 있습니다.

GPT-3.5 Turbo, Llama-2-70B-Chat 및 Zephyr-7B-beta와 비교하면, Starling-7B는 여러 작업에서 유리한 성능을 보입니다. 하지만 수학 및 추론 능력에서는 GPT-4보다는 아직 뒤쳐지는 상태입니다.

로컬에서 Ollama를 사용하여 Starling-7B 실행하기

Starling-7B의 주요 장점 중 하나는 오픈 소스 LLM을 배포하는 도구인 Ollama를 사용하여 로컬에서 실행할 수 있다는 것입니다. 다음은 시작하는 데 필요한 단계별 안내입니다:

  1. Ollama 설치는 Ollama 설명서에서 제공하는 설치 지침을 따라 진행합니다.

  2. 다음 명령을 사용하여 Starling-7B 모델을 가져옵니다.

    ollama run starling-lm
  3. (선택 사항) 특정 요구 사항에 따라 매개 변수를 구성하기 위해 사용자 정의 모델 파일을 작성합니다. 이를 통해 모델의 동작을 세밀하게 조정할 수 있습니다. 다음 명령을 사용하여 모델을 실행합니다:

    ollama run starling-lm

스탈링-7B를 로컬에서 실행할 때는 메모리 요구 사항과 계산 리소스를 고려하는 것이 중요합니다. 이 모델은 상당한 양의 메모리가 필요하므로 시스템이 최소 사양을 충족하는지 확인하세요.

제한 사항과 향후 개발

스탈링-7B는 훌륭한 성능을 보여주었지만 여전히 일부 제한 사항이 있습니다. 이 모델은 GPT-4와 같은 고급 모델에 비해 수학, 추론 및 코딩 작업에 어려움을 겪을 수 있습니다. 또한, 스탈링-7B는 과다한 설명성을 가지는 경향이 있어 모든 사용 사례에 적합하지 않을 수 있습니다.

연구자들은 이러한 제한 사항을 해결하기 위해 모델, 데이터셋 및 훈련 방법을 개선하기 위해 노력하고 있습니다. 공개 소스의 지속적인 노력이 이어짐에 따라 LLM 기술이 보다 널리 사용 가능해질 것으로 기대할 수 있습니다.

결론

스탈링-7B는 오픈소스 언어 모델 개발에서 중요한 마일스톤을 나타냅니다. 올라마를 사용하여 로컬에서 실행할 수 있는 스탈링-7B의 탁월한 성능은 연구자, 개발자 및 열정적인 사람들에게 가치있는 도구로 작용합니다.

오픈소스 LLM의 가능성을 계속 탐구함에 따라, 스탈링-7B와 같은 모델은 혁신을 주도하고 고급 언어 기술에 대한 접근성을 더욱 폭넓은 대중에게 보다 더 거민 점유할 수 있을 것입니다. 오픈소스 커뮤니티 내의 지속적인 개선과 협력을 통해 앞으로 더욱 강력하고 다재다능한 언어 모델을 기대할 수 있습니다.

Anakin AI - The Ultimate No-Code AI App Builder