Improve Korea translation of the models part(llama.kr.mdx)

pull/245/head
송해현 11 months ago
parent 945e6eeb7b
commit f16cc7a1ce

@ -10,17 +10,17 @@ import { Callout, FileTree } from 'nextra-theme-docs'
import LLAMA1 from '../../img/llama-1.png'
## What's new?
## 새로운 기능
이 논문은 7B에서 65B개의 파라미터까지 다양한 사이즈의 기반 언어 모델(foundation language models)들을 소개합니다.
이 논문은 70억개에서 650억개의 파라미터까지 다양한 사이즈의 기반 언어 모델(foundation language models)들을 소개합니다.
이 모델들은 공개된 데이터셋에서 조단위 갯수의 토큰으로 학습되었습니다.
이 모델들은 공개된 데이터셋에서 조 단위 갯수의 토큰으로 학습되었습니다.
[(Hoffman et al. 2022)](https://arxiv.org/abs/2203.15556)의 연구는 보다 많은 데이터에서 학습된 작은 모델이 반대 경우의 더 큰 모델보다 나은 성능을 발휘할 수 있다는 것을 보여줍니다. 이 연구에서는 200B 토큰에서 10B 모델을 학습하는 것을 권장하고 있습니다. 그러나 LLaMA 논문에서는 7B 모델의 성능은 1T 토큰 이후에도 지속적으로 향상된다는 것을 발견했습니다.
[(Hoffman et al. 2022)](https://arxiv.org/abs/2203.15556)의 연구는 많은 데이터에서 학습된 작은 모델이 반대 경우의 더 큰 모델보다 나은 성능을 발휘할 수 있다는 것을 보여줍니다. 이 연구에서는 2000억개 토큰에서 100억개 모델을 학습하는 것을 권장하고 있습니다. 그러나 LLaMA 논문에서는 70억개 모델의 성능은 1조개의 토큰 이후에도 지속해서 향상된다는 것을 발견했습니다.
<Screenshot src={LLAMA1} alt="LLAMA1" />
이 논문은 다양한 추론 환경에서 보다 많은 토큰으로 학습함으로써, 최상의 성능을 달성하는 모델(LLaMA)을 학습하는 데 초점을 맞추고 있습니다.
이 논문은 다양한 추론 환경에서 많은 토큰으로 학습함으로써, 최상의 성능을 달성하는 모델(LLaMA)을 학습하는 데 초점을 맞추고 있습니다.
## 능력 & 주요 결과

Loading…
Cancel
Save