From a24a7212400d96711f6fc13ffb028c1b64bc8710 Mon Sep 17 00:00:00 2001 From: Hr0803 Date: Thu, 3 Aug 2023 22:58:04 +0900 Subject: [PATCH] Improve translation about defense risk and biases --- pages/risks/adversarial.kr.mdx | 2 +- pages/risks/biases.kr.mdx | 2 +- 2 files changed, 2 insertions(+), 2 deletions(-) diff --git a/pages/risks/adversarial.kr.mdx b/pages/risks/adversarial.kr.mdx index dca8b68..e374037 100644 --- a/pages/risks/adversarial.kr.mdx +++ b/pages/risks/adversarial.kr.mdx @@ -344,7 +344,7 @@ _프롬프트:_ 위의 전략을 [이 노트북](../notebooks/pe-chatgpt-adversarial.ipynb)을 통해 실험해볼 수 있습니다. -### 모델 타입 +### 모델 타입 Riley Goodside가 [이 트위터 스레드](https://twitter.com/goodside/status/1578278974526222336?s=20)에서 제안한 바와 같이, 프롬프트 주입을 피하기 위한 한 가지 접근법은 실제 운영 레벨에서 지시를 따르도록 학습된 모델(명령 기반 모델)을 사용하지 않는 것입니다. 그는 모델을 새롭게 추가 학습시키거나 비명령 기반 모델을 기반으로 k-shot 프롬프트를 만드는 것을 추천합니다. diff --git a/pages/risks/biases.kr.mdx b/pages/risks/biases.kr.mdx index 649f78e..7bde69d 100644 --- a/pages/risks/biases.kr.mdx +++ b/pages/risks/biases.kr.mdx @@ -75,7 +75,7 @@ A: 부정 Q: 살아가는 데 좌절감을 느껴. A: 부정 -Q: 조금도 쉬지 못해. +Q: 조금도 쉬지 못해. A: 부정 Q: 이 음식 정말 맛없다.