인공지능(AI)

라마2 발표 및 새로운 인공지능 모델 소개

슈가가족 2023. 9. 2. 00:04

Code Llama 코드라마 인공지능프로그램 언어 인공지능(AI)프로그램머를 개인 PC속으로 

 

안녕하세요! 오늘은 페이스북 메타에서 발표한 라마2와 관련된 새로운 인공지능 모델에 대해 알아보겠습니다. 라마2는 이전에 발표된 Llama 1 모델의 후속작으로, 다양한 개선 사항과 특징을 가지고 있습니다.

 

라마2 소개

라마2는 파운데이션 모델로서 시작하여 파인튜닝을 통해 다양한 모델을 생성하는 기반을 제공합니다. 이 모델은 초기에는 연구용으로 배포되었으나, 이후 유출되면서 다양한 파생 모델이 개발되었습니다.

 

라이센스 변경

 

Llama 1 모델은 GPL 라이센스를 사용하였기 때문에 상업용으로 사용하기 어려웠습니다. 그러나 Llama 2는 상업용으로 사용이 가능하다는 큰 변화를 가져왔습니다.

 

다운로드와 사용

 

모델 다운로드와 사용은 상대적으로 간단하며, HuggingFace의 TheBloke 등의 소스에서 다양한 모델을 얻을 수 있습니다. 모델은 CPU 및 GPU 버전, 16비트 모델 등 다양한 형태로 제공되므로 사용자의 요구에 맞게 선택할 수 있습니다.

 

 

라마2 모델 특징

 

파라미터 개수: 라마2는 70B, 130B, 700B 모델 세 가지로 발표되었습니다. 상업용 GPU에서 사용하기 위한 70B 모델도 포함되어 있습니다.

트레이닝 데이터: 40% 늘어난 트레이닝 데이터를 사용하여 모델이 개선되었습니다.

아키텍처: PRETRAINED 모델의 파라미터 개수가 2조로 증가하였고, Context Length도 4096으로 확장되었습니다.

새로운 Chat 모델

 

라마2와 함께 발표된 Chat 모델은 이전과 다른 맥락 파악 능력을 가지고 있으며, 텍스트 생성 및 대화형 작업에 효과적으로 활용될 수 있습니다.

 

모델 성능 비교

 

라마2 모델은 다른 대중적인 모델과 비교했을 때 높은 성능을 보이며, 특히 13B 모델은 다른 30B 및 40B 모델과 유사한 성능을 제공합니다.

 

모델 다운로드 및 테스트

 

모델 다운로드 및 테스트는 간단하며, TheBloke의 소스를 통해 모델을 받아와서 실행할 수 있습니다. 코드의 단순화와 퍼포먼스 향상을 위한 리팩터링도 가능합니다.

 

Code Llama 받는곳 

https://github.com/facebookresearch/llama/tree/main

 

GitHub - facebookresearch/llama: Inference code for LLaMA models

Inference code for LLaMA models. Contribute to facebookresearch/llama development by creating an account on GitHub.

github.com

 

모델 다운 받는 곳 
https://huggingface.co/TheBloke

 

TheBloke (Tom Jobbins)

TheBloke/Yarn-Llama-2-13B-128K-GPTQ Updated about 3 hours ago

huggingface.co

 

자동화 가능성

 

라마2 모델은 ChatGPT와 유사한 대화 형식을 지원하므로, 자동화 및 응용 가능성이 높아집니다.

이상으로 라마2 모델과 관련된 주요 내용을 소개해보았습니다. 이 모델을 통해 더 나은 인공지능 기술을 개발하고 다양한 분야에서 활용할 수 있을 것으로 기대됩니다. 라마2 모델을 사용해 보는 것도 흥미로울 것입니다!