TL;DR
- Chain-of-Thought(CoT)๋ LLM์ ๋จ๊ณ์ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ทน๋ํํ์ฌ ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ์ ๋ฐ์ด๋ ์ฑ๊ณผ๋ฅผ ๋ณด์ฌ์ฃผ๋ ํต์ฌ ํ๋กฌํํธ ๊ธฐ๋ฒ
- ๋ํ ๋ชจ๋ธ์์ ํนํ ํจ๊ณผ์ ์ด๋ฉฐ, ๋ค์ํ ๋ถ์ผ์ ๋ฌธ์ ์ ์ ์ฉ๋์ด ๋ชจ๋ธ์ ์ ๋ต๋ฅ ๊ณผ ์ ๋ขฐ๋ ํฅ์์ ๊ธฐ์ฌํ๊ณ ์์
- CoT ๊ธฐ๋ฒ์ ๋ต๋ณ๊ณผ ํจ๊ป ์ถ๋ก ๊ณผ์ ์ ์ ๊ณตํจ์ผ๋ก์จ AI ์๋ต์ ํฌ๋ช ์ฑ๊ณผ ์ค๋ช ๋ ฅ์ ๋์ฌ์ค
- CoT๋ RAG ๊ฒฐํฉ, ์์ฒด ๊ฒ์ฆ(chain-of-verification) ๋ฑ๊ณผ ๊ฐ์ด ์งํ๋ ํํ๋ก ์ง์์ ์ผ๋ก ์ฐ๊ตฌ ๋ฐ ๋ฐ์ ๋๊ณ ์์
๊ฐ๋ ๋ฐ ์ ์
- **Chain-of-Thought(CoT)**๋ ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ด ๋ณต์กํ ๋ฌธ์ ๋ฅผ ๋จ๊ณ์ ์ผ๋ก ์ถ๋ก ํ์ฌ ๋ต์ ๋์ถํ๋๋ก ์ ๋ํ๋ ํ๋กฌํํธ ๊ธฐ๋ฒ
- ๋จ์ํ ์ต์ข ๋ต๋ณ๋ง ์๊ตฌํ๋ ๋์ , ๋ฌธ์ ํด๊ฒฐ ๊ณผ์ ์ _๋ ผ๋ฆฌ์ ์ด๊ณ ์์ฐจ์ ์ผ๋ก ๊ธฐ์ ํ๊ฒ ํจ_์ผ๋ก์จ ๋ชจ๋ธ์ ์ถ๋ก ๋ฅ๋ ฅ์ ๋์ด๋
- ๋ชจ๋ธ์ด ์ฌ๋์ฒ๋ผ ๋ฌธ์ ๋ฅผ ์์ ๋ถ๋ถ์ผ๋ก ๋ถํดํ๊ณ โ์๊ฐ์ ํ๋ฆโ์ ๋ช ์์ ์ผ๋ก ์์ฑํ์ฌ ์ต์ข ๋ต์ ์ฐ์ถ
๋ฑ์ฅ ๋ฐฐ๊ฒฝ ๋ฐ ํ์์ฑ
- ๊ธฐ์กด LLM๋ค์ ๋ณต์กํ ์ํ ๋ฌธ์ , ๋ ผ๋ฆฌ ์ถ๋ก , ๋ฉํฐํ QA1 ๋ฑ ๋ค๋จ๊ณ ์ถ๋ก ์ด ํ์ํ ์์ ์์ ๋จ์ผ ์๋ต๋ง ์์ฑํ ๊ฒฝ์ฐ ์ค๋ฅ๊ฐ ์ฆ์์
- ํ๋ผ๋ฏธํฐ ์๊ฐ ์ฆ๊ฐํด๋ ๋ค๋จ๊ณ ์ถ๋ก ๊ณผ์ ์์๋ ์ฑ๋ฅ ํฅ์์ด ๋ฏธ๋ฏธํ๋ค๋ ํ๊ณ๊ฐ ์์์
- ์ฌ๋์ ์ด๋ ค์ด ๋ฌธ์ ๋ฅผ ํ ๋ ์ค๊ฐ ๊ณ์ฐ๊ณผ ๋ ผ์ฆ ๊ณผ์ ์ ๊ฑฐ์น๋ฏ, ๋ชจ๋ธ๋ ์ค๊ฐ ์ถ๋ก ๋จ๊ณ๋ฅผ ๊ฑฐ์น๊ฒ ํ์ฌ ์ ํ๋์ ์ ๋ขฐ์ฑ์ ๋์ด๊ธฐ ์ํด CoT ๊ธฐ๋ฒ์ด ๋์
- ์ค์ ๋ก ๋ค๋จ๊ณ ์ถ๋ก , ๋ณตํฉ ์ง์์๋ต, ์ํ์ ๊ณ์ฐ ๋ฑ์์ CoT๋ฅผ ์ฌ์ฉํ๋ฉด ๋ชจ๋ธ ๋ต๋ณ์ ์ ํ๋๊ฐ ํฅ์๋๊ณ ์ค๋ฅ๋ฅผ ์ค์ผ ์ ์์์ด ๋ณด๊ณ
์ฃผ์ ๋์ ๋ฐฉ์
- CoT ๊ตฌํ ์ ํ๋กฌํํธ์ ์ค๊ฐ ์ถ๋ก ๊ณผ์ ์ ์๊ตฌํ๋ ์ง์๋ฌธ์ ํฌํจํ๊ฑฐ๋, ์์ ๋ต๋ณ์ ๋จ๊ณ๋ณ ์ถ๋ก ์์๋ฅผ ์ ๊ณต
- โ๋ฌธ์ ๋ฅผ ์ฒ์ฒํ ๋จ๊ณ๋ณ๋ก ์๊ฐํด๋ดโ ๋๋ โ์ด์ ๋ฅผ ์ค๋ช ํ๋ฉด์ ํ์ด๋ดโ์ ๊ฐ์ ์ง์๋ฅผ ์ง๋ฌธ ๋์ ์ถ๊ฐํ๋ฉด, ๋ชจ๋ธ์ด ์์ฐ์ด๋ก ์ฌ๊ณ ๊ณผ์ ์ ๋จ๊ณ๋ณ๋ก ์ถ๋ ฅ
- ์ง๋ฌธ์ ์ฝ์ ๋ค ํ์ํ ์ถ๋ก , ๊ณ์ฐ, ์กฐ๊ฑด ์ ๊ฒ ๋ฑ์ ์์ฐจ์ ์ผ๋ก ์์ ํ๊ณ ๋ง์ง๋ง์ ์ต์ข ๋ต์ ์ ์
- ์์: ์ํ ๋ฌธ์ ์์ โ1๋จ๊ณ: ์ฃผ์ด์ง ๊ฐ์ ์ด์ฉํด A ๊ณ์ฐ, 2๋จ๊ณ: ๊ฒฐ๊ณผ๋ฅผ ์ด์ฉํด B ๊ณ์ฐ, โฆ ์ต์ข ๋ต: Xโ์ ๊ฐ์ด ์ค๊ฐ ๊ณ์ฐ๊ณผ์ ์ ๊ฑฐ์ณ ๋ต์ ๋์ถ
๋ํ ์ฐ๊ตฌ ๋ฐ ์ฑ๋ฅ ํฅ์ ์ฌ๋ก
- 2022๋ Google ์ฐ๊ตฌ์์๋ GPT-3 ๋ฑ LLM์ CoT ํ๋กฌํํธ๋ฅผ ์ ์ฉํ์ ์ํ, ๋ ผ๋ฆฌ, ๋ฉํฐํ QA ๊ณผ์ ์์ ์ฑ๋ฅ์ด ํฌ๊ฒ ํฅ์
- ๋๊ท๋ชจ ๋ชจ๋ธ์ผ์๋ก CoT์ ํจ๊ณผ๊ฐ ๋๋ ทํด PaLM 540B ๋ชจ๋ธ์ ์ํ ์๋๋ฌธ์ benchmark(GSM8K)2์์ ๊ธฐ์กด SOTA๋ฅผ ๋ฅ๊ฐํ๋ 58%์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ๊ณ , self-consistency ๊ธฐ๋ฒ3์ ๊ฒฐํฉํด 74%๊น์ง ํฅ์
- Zero-shot CoT ๊ธฐ๋ฒ์ด ๋ฑ์ฅํ์ฌ, ๋ณ๋์ ์์ ์์ด๋ **โLetโs think step by stepโ**๊ณผ ๊ฐ์ ํ ๋ฌธ์ฅ์ ํ๋กฌํํธ์ ์ถ๊ฐํ๋ ๊ฒ๋ง์ผ๋ก ๋ชจ๋ธ์ ๋จ๊ณ์ ์ถ๋ก ์ ์ ๋ํ ์ ์์์ด ๋ฐ๊ฒฌ
- ๋ชจ๋ธ์ด ์ฌ์ ์์ ์์ด๋ ์์ฒด์ ์ผ๋ก CoT๋ฅผ ์์ฑํ๋ฉฐ ๋ต์ ์ฐพ์ ์ ์์์ ์์ฐ
- Few-shot CoT๋ ์ฌ๋ฌ Q&A ์์์ ์ค๊ฐ ์ถ๋ก ๋จ๊ณ๋ฅผ ํฌํจ์์ผ ๋ชจ๋ธ์ ์๋ฒ์ ๋ณด์ฌ์ฃผ๋ ๋ฐฉ์
- CoT ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ๋ฉด ๋ค๋จ๊ณ ๋ฌธ์ ์์ ์ ๋ต๋ฅ ์ด ํฌ๊ฒ ํฅ์๋๋ฉฐ, ์ผ๋ถ ๊ณผ์ ์์๋ ๊ธฐ์กด ๋๋น ๋ ๋ฐฐ์ ๊ฐ๊น์ด ์ฑ๋ฅ ํฅ์๋ ๊ด์ฐฐ
- ์ค๊ฐ ์ฌ๊ณ ๊ณผ์ ์ ํํํ๊ฒ ํจ์ผ๋ก์จ ๋ชจ๋ธ์ โํ ๋ฃจ์๋ค์ด์ โ(์ฌ์ค๊ณผ ๋ค๋ฅธ ํ์์๋ต) ํ์์ด ์ค์ด๋ค๊ณ , ๋ต๋ณ์ ์ ํ์ฑ ๋ฐ ์ค๋ช ๊ฐ๋ฅ์ฑ์ด ๋์์ง๋ค๋ ํ๊ฐ๋ฅผ ๋ฐ์
ํ์ฉ ๋ถ์ผ
- ์ํ ๋ฌธ์ ํ์ด(์ฐ์ ๊ณ์ฐ, ์์ฉ๋ฌธ์ ), ๋ ผ๋ฆฌ์ ์ถ๋ก ์ด ํ์ํ ์ง์์๋ต(ํผ์ฆ, ๋ ผ์ฆ ๋ฌธ์ ), ๋ฉํฐํ ์ ๋ณด ๊ฒ์(์ฌ๋ฌ ์ถ์ฒ์ ์ ๋ณด๋ฅผ ์ข ํฉํ๋ QA) ๋ฑ์์ ๋๋ฃจ ํ์ฉ
- ๊ฐ ๋จ๊ณ๋ฅผ ๊ฒ์ฆํ๋ฉฐ ์งํํ๋๋ก ํ์ฌ ์ฑ๋ฅ ํฅ์์ ์ด๋์ด๋
- ๋ฒ๋ฅ , ์๋ฃ ๋ฑ ๋ณต์กํ ํ๋จ๊ณผ ์ ๋ฌธ ์ง์์ด ์๊ตฌ๋๋ ์์ญ์์๋ ๋จ๊ณ์ ์ฌ๊ณ ๋ฅผ ํตํด ๋ ์ ๋ขฐ๋ ๋์ ๋ต๋ณ์ ์ป๊ธฐ ์ํ ์๋๊ฐ ์ด๋ฃจ์ด์ง๊ณ ์์
- ์ต๊ทผ์๋ CoT๋ฅผ ๊ฒ์ ๊ธฐ๋ฐ ์์ฑ(RAG, Retrieval-Augmented Generation)์ด๋ ๋ค์ค ์์ด์ ํธ ์์คํ ๊ณผ ๊ฒฐํฉํ์ฌ, ๋ณต์กํ ์ ๋ณด ์ถ๋ก ๋ฐ ๋ถ์์ ํ์ฉํ๋ ์ฐ๊ตฌ๋ ํ๋ฐ
- ๋ค์ค ์์ด์ ํธ RAG ํ๋ ์์ํฌ์์๋ ๊ฐ ์์ด์ ํธ๊ฐ CoT ๋ฐฉ์์ ํ๋กฌํํธ๋ก ๋จ๊ณ๋ณ ์ถ๋ก ์ ๊ณต์ ํ๋ฉฐ ํ๋ ฅํจ์ผ๋ก์จ, ๋ชจ๋ธ์ ํด์๋ ฅ๊ณผ ๋ณต์กํ ์ง์์ ๋ํ ์ฑ๋ฅ์ ํฅ์
ํ๊ณ ๋ฐ ๊ณผ์
- CoT๊ฐ ํญ์ ์ ๋ต์ ๋ณด์ฅํ๋ ๊ฒ์ ์๋๋ฉฐ, ์ค๊ฐ ์ถ๋ก ๊ณผ์ ์์ฒด์ ์ค๋ฅ๊ฐ ์์ ๊ฒฝ์ฐ ์๋ชป๋ ๊ฒฐ๋ก ์ ๋๋ฌํ ์ํ์ด ์์
- ๋ชจ๋ธ์ ์ง์๋ ์ถ๋ก ๋จ๊ณ๋ฅผ ์ถฉ์คํ ๋ฐ๋ฅด์ง๋ง ์ด๋ฐ ๋จ๊ณ์ ์ค์๊ฐ ์์ผ๋ฉด ๊ทธ๋๋ก ์ค๋ต์ด ์ ํ๋๋ ์ค๋ฅ ์ ํ(error propagation) ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์์
- CoT์ ํจ๊ณผ๋ ํ๋กฌํํธ ์ค๊ณ์ ์์ ์ ํ์ ํฌ๊ฒ ์ข์ฐ๋์ด, ์์๋ฅผ ์ด๋ป๊ฒ ์ ์ํ๋๋์ ๋ฐ๋ผ ์ฑ๋ฅ ํธ์ฐจ๊ฐ ํผ
- ์ฌ์ด ์์ ์ ๋ถํ์ํ๊ฒ CoT๋ฅผ ๋จ์ฉํ๋ฉด ์๋ต์ด ๊ณผ๋ํ๊ฒ ๋ณต์กํด์ง๋ ๋จ์ ์ด ์์
- ์ถ๋ก ๋จ๊ณ๊ฐ ์ถ๊ฐ๋จ์ ๋ฐ๋ผ ํ ํฐ ์ ์ฆ๊ฐ ๋ฑ ๋ชจ๋ธ์ ๊ณ์ฐ ๋น์ฉ๊ณผ ์๋ต ์๊ฐ์ด ๋์ด๋๋ ํ์ค์ ์ ์ฝ๋ ์กด์ฌ
- CoT์ ํจ๊ณผ๋ ๋ชจ๋ธ ๊ท๋ชจ๊ฐ ์ถฉ๋ถํ ํด ๋ ๋น๋ก์ ๋ฐํ๋๋ ๊ฒฝํฅ์ด ์์ด์, ํ๋ผ๋ฏธํฐ ์๊ฐ ์์ ๋ชจ๋ธ๋ค์ CoT๋ฅผ ์ ๋๋ก ์ ์งํ์ง ๋ชปํ๊ณ ๋น๋ ผ๋ฆฌ์ ์ธ ์ค๊ฐ๋จ๊ณ๋ฅผ ์์ฑํ๋ ํ๊ณ๊ฐ ์์
- ๋ณต์กํ ๋ฌธ์ ๋ ์ง์์ด ํ์ํ ๊ณผ์ ์ ๊ฒฝ์ฐ CoT๋ฅผ ์ฐ๋๋ผ๋ ์ฌ์ ํ ์ค๋ต์ ๋ผ ์ ์์ผ๋ฉฐ, ์ด๋ฌํ ํ๊ณ๋ฅผ ๋ณด์ํ๊ธฐ ์ํ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํจ
Footnotes
-
ํ ๋ฒ์ ์ ๋ณด๋ง์ผ๋ก๋ ๋ต์ ์ฐพ์ ์ ์๋, ์ฌ๋ฌ ๊ฐ์ ๋จ์๋ฅผ ์์ฐจ์ ์ผ๋ก ์ฐ๊ฒฐํด ์ต์ข ๋ต์ ๋์ถํด์ผ ํ๋ ์ง์์๋ต Task (e.g., ์์ธ์ํ์ธ์ด ํ์ด๋ ๋์์ ํ์ฌ ์ธ๊ตฌ๋?) โฉ
-
์ธ๊ณต์ง๋ฅ ์ธ์ด ๋ชจ๋ธ์ ์ํ์ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ฐํ๊ธฐ ์ํด ๋ง๋ค์ด์ง ๋ฐ์ดํฐ์ ์ผ๋ก ์ฃผ๋ก ์ด๋ฑํ๊ต ์์ค์ ์ฐ์ ๋ฐ ์์ฉ ์ํ ๋ฌธ์ 8,500์ฌ ๊ฐ๋ก ๊ตฌ์ฑ๋์ด ์์ โฉ
-
๋จ๊ณ์ ์ถ๋ก ๋ฐฉ์์ผ๋ก ๋ฌธ์ ๋ฅผ ํ ๋, ํ ๋ฒ๋ง ๋ต์ ์์ฑํ๋ ๋์ ์ฌ๋ฌ ๋ฒ(์: 20~100ํ) ๋ต๋ณ์ ์์ฑํ๊ณ , ๊ทธ ์ค์์ ๊ฐ์ฅ ๋น๋๊ฐ ๋์(๋ค์๊ฒฐ) ๋ต์ ์ต์ข ์ ๋ต์ผ๋ก ์ฑํํ๋ ๋ฐฉ๋ฒ โฉ