๐ข ๋ค์ด๊ฐ๋ฉฐ
์์ฆ IT์ ๊ด์ฌ์ด ์๋ ์ฌ๋์ด๋ผ๋ ํ๋ฒ์ฉ์ ์ฑGPT ๋ผ๋ ๋ง์ ๋ค์ด๋ดค์ ๊ฒ์ด๋ค.
์ฑGPT์ ์ฑํ
์ ํ๋ ์ปจํ
์ธ ๋ฅผ ์ ์ํ๋ ์ ํ๋ฒ๋ ๋ณด์ด๊ณ , ๋ด์ค์์๋ ์์ฃผ ์ธ๊ธ๋๊ณ ์๋ค.
๋์ถฉ ์ฑ(Chat) ์ด๋ผ๋ ๋ง์ด ๋ค์ด๊ฐ๋ ๊ฑธ ๋ณด๋ฉด ์ฑํ
์ ํ๋ ์ด๋ค ๊ฒ์ด๋ผ๊ณ ์ถ์ธกํ ์ ์๋๋ฐ,
์ฑGpt ๋ ์ ํํ ์ด๋ค ๊ฑธ ์๋ฏธํ๋ ๊ฑธ๊น?
์ด๋ฒ ํฌ์คํ
์์ ์์ฆ ํซํ ์ฑGPT ์ ๋ํด ์์๋ณธ๋ค.
๐ง ChatGPT ๋?
ChatGPT ๋ AI ๊ธฐ์ ๋ก ๊ตฌ๋๋๋ ์์ฐ์ด ์ฒ๋ฆฌ ๋๊ตฌ์ด๋ค.
์์ฐ์ด, ์ฆ, ์ฐ๋ฆฌ๊ฐ ์ผ์ ์์์ ์ฌ์ฉํ๋ ์ธ์ด๋ฅผ ๋งํ๋ค.
์ฝ๊ฒ ์๊ธฐํ์๋ฉด,
์ผ์ ์ ์ธ์ด๋ฅผ ๊ตฌ์ฌํ ์ ์๋ AI(์ธ๊ณต์ง๋ฅ)์ ChatGPT ๋ผ๊ณ ํ๋ค.
๐ง ChatGPT ์ฌ์ฉ๋ฒ
https://openai.com/blog/chatgpt
์ ChatGPT ๊ณต์ ํํ์ด์ง์์ Try ChatGPT ๋ผ๋ ๋ฒํผ์ ๋๋ฅด๋ฉด ChatGPT ๋ฅผ ์ฌ์ฉํด ๋ณผ ์ ์๋ค.
(์์ง์ ์ฐ๊ตฌ๋จ๊ณ์ด๊ธฐ ๋๋ฌธ์ ๋ฌด๋ฃ๋ก ์ฌ์ฉ ๊ฐ๋ฅํ๋ค.)
์ฑํ
์ ๋๋ ์ ์๋ ์น ํ๋ฉด์ด ๋ณด์ด๊ณ , ์ข์ธก์ ์ฑํ
history ์ ๋ฉ๋ด๊ฐ ์๋ค.
๋๋ ์ฑGPT์ ๋ํ๋ฅผ ์กฐ๊ธ ๋๋ ๋ณด์๋๋ฐ,
๊ฐ์ธ์ ์ผ๋ก ์กฐ๊ธ ๋ ๋ง์ ์ ๋ณด๋ฅผ ์๋ ค์ฃผ๋? ๋๋ํด์ง ์ฌ์ฌ์ด๋ผ๊ณ ๋๊ปด์ก๋ค. ใ
ใ
๐ง ChatGPT ๋ ๋๊ฐ ๋ง๋ค์๋๊ฐ?
๋๋ ์ด๋ฐ ํ๊ธ๋ ฅ์ด ์ผ ์ดํ๋ฆฌ์ผ์ด์
์ ๋ณด๋ฉด ๋ง์ฐํ ๊ตฌ๊ธ์ด ๋ง๋ค์๊ฒ ๊ฑฐ๋ ํ๋ ๊ฒฝํฅ์ด ์๋ค. ใ
ใ
์ด ChatGPT ์ญ์ ๊ตฌ๊ธ์ด ๋ง๋ค์๊ฒ ์ง? ํ๋๋ฐ ์๋์๋ค!
ChatGPT๋ AI ๋ฐ ์ฐ๊ตฌ ํ์ฌ์ธ OpenAI์์ ๋ง๋ค์ด์ก๋ค.
OpenAI๋ 2022๋
11์ 30์ผ์ ChatGPT๋ฅผ ์ถ์ํ๋ค.
๊ธฐ์
๋ช
์ด ๋ด๊ฒ ๋ค์ ์์ํ๋๋ฐ, ๊ทธ๋ด๋งํ๋ค.
๋น๊ต์ ์ต๊ทผ์ธ 2015๋
์ ์ค๋ฆฝ๋์๊ณ ์ธ๊ณต์ง๋ฅ ๊ด๋ จ ์ ํ๋ง์ ์ฐ๊ตฌ, ์ถ์ํ๊ณ ์๋ค.
๊ณต๋์ฐฝ์
์ ์ค ํ ์ฌ๋์ด ๊ทธ ์ ๋ช
ํ ์ผ๋ก ๋จธ์คํฌ์ด๋ค.
์ฐธ๊ณ ๋ก, ์ผ๋ก ๋จธ์คํฌ๋ ํ์ฌ OpenAI ๋ฅผ ๋ ๋ ์ํ์ด๋ค.
๐ง GPT ๋?
ChatGPT ๋ GPT ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋์ํ๋ค.
๋๋๊ณ Chat + GPT ๋ผ๊ณ ๋ช ์๋์ด ์๋ค.
์ด GPT ๋ ๋์ฒด ๋ฌด์์ผ๊น?
GPT๋ OpenAI์์ ์ถ์ํ ์ธ์ด๋ชจ๋ธ๋ก, ์์ฐ์ด ์ฒ๋ฆฌ ์์
์ ํ๋ค.
์ ์ด ํ์ต ๋ชจ๋ธ์ด๋ผ๊ณ ๋ ํ๋ค.
Generative Pre-trained Transformer์ ์ค์๋ง์ด๋ค.
์ง์ญํ๋ฉด, ์์ฑ์ ์ฌ์ ํ์ต ๋ณํ๊ธฐ ๋ผ๋ ๋ป์ธ๋ฐ,
์ ํ ๋ฌด์จ ๋ง์ธ์ง ๋ชจ๋ฅด๊ฒ ๋ค.
์ฐจ๊ทผ์ฐจ๊ทผ ์์๋ณด์.
๐ ์ธ์ด๋ชจ๋ธ์ด๋?
GPT๋ OpenAI์์ ์ถ์ํ ์ธ์ด๋ชจ๋ธ๋ก, ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์ ํ๋ค.
์ ์ด ํ์ต ๋ชจ๋ธ์ด๋ผ๊ณ ๋ ํ๋ค.
์ธ์ด๋ชจ๋ธ์ด๋,
๋ฌธ์ฅ ํน์ ๋จ์ด์ ํ๋ฅ ์ ํ ๋นํ์ฌ ์ปดํจํฐ๊ฐ ์ฒ๋ฆฌํ ์ ์๋๋ก ํ๋ ๋ชจ๋ธ์ด๋ค.
์ฌ๊ธฐ์ ๋ชจ๋ธ์ด๋,
๋จธ์ ๋ฌ๋์์ ์ฌ์ฉ๋๋ ์ฉ์ด๋ก, "ํ๋ก๊ทธ๋จ"์ด๋ผ๋ ๋ป์ด๋ค.
๋ณดํต ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ... ์ด๋ฐ์์ผ๋ก ๋ถ๋ฆฌ๋๋ฐ,
์ธ๊ณต์ง๋ฅ ํ๋ก๊ทธ๋จ ์ด๋ผ๊ณ ๋งํ๋ ๊ฒ๊ณผ ๊ฐ๋ค.
์ฆ, ์ธ์ด๋ชจ๋ธ์,
๋ฌธ์ฅ ํน์ ๋จ์ด์ ํ๋ฅ ์ ํ ๋นํ์ฌ ์ปดํจํฐ๊ฐ ์ฒ๋ฆฌํ ์ ์๋๋ก ํ๋ ํ๋ก๊ทธ๋จ์ด๋ค.
์ข ๋ ํ์ด์ ์ค๋ช
ํ์๋ฉด,
๊ธฐ์กด์ ๋ฐ์ดํฐ์
์ ๋ฐํ์ผ๋ก ์ฃผ์ด์ง ํ์คํฌ ์์์์ ๋จ์ด ํน์ ๋ฌธ์ฅ์ ์์ธกํ๋ ์์
์ ๋ปํ๋ค.
์ด๋ฅผ ์ธ์ด๋ชจ๋ธ๋ง์ด๋ผ๊ณ ๋ ํ๋ค.
๐ ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์ด๋?
GPT๋ OpenAI์์ ์ถ์ํ ์ธ์ด๋ชจ๋ธ๋ก, ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์ ํ๋ค.
์ ์ด ํ์ต ๋ชจ๋ธ์ด๋ผ๊ณ ๋ ํ๋ค.
Natural Language Processing.
NLP ๋ผ๊ณ ๋ถ๋ฆฐ๋ค.
์ธ์ด ๋ชจ๋ธ์ด ๋จ์ด๋ ๋ฌธ์ฅ์ ์์ธกํ๋ ํ๋ก๊ทธ๋จ์ด๋ ๊ฒ์ ์์๋ค.
์ด ์ธ์ด๊ฐ ์์ฐ์ด์ด๋ฉด, ์ฆ, ์ผ์ ์์์ ์ฌ์ฉํ๋ ์ธ์ด์ด๋ฉด ์์ฐ์ด ์ฒ๋ฆฌ๊ฐ ๋๋ ๊ฒ์ด๋ค.
๊ฒฐ๋ก ์ ์ผ๋ก, ์ผ์ ์์์ ์ฌ์ฉํ๋ ๋จ์ด๋ ๋ฌธ์ฅ์ ์์ธกํ๋ ์์ ์ ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์ด๋ผ๊ณ ํ๋ค.
๐ ์ ์ด ํ์ต ๋ชจ๋ธ์ด๋?
GPT๋ OpenAI์์ ์ถ์ํ ์ธ์ด๋ชจ๋ธ๋ก, ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์ ํ๋ค.
์ ์ด ํ์ต ๋ชจ๋ธ์ด๋ผ๊ณ ๋ ํ๋ค.
์ ์ด ํ์ต(Transfer Learning)์ ์์๋ณด๊ธฐ ์ ์, ํ์ต์ด๋ผ๋ ์ฉ์ด์ ๋ํด ์์๋ณด์.
์ฌ๊ธฐ์ ์ฌ์ฉ๋ "ํ์ต"์ ๋จธ์ ๋ฌ๋์์ ์ฌ์ฉ๋๋ ์ฉ์ด์ด๋ค.
ํ์ต์ ์ปดํจํฐ๊ฐ ์ค์ค๋ก ๋ฐ์ดํฐ์ ๊ท์น์ ์ฐพ๋ ๊ธฐ์ ์ ์๋ฏธํ๋ค.
ํ์ต์ ๋จธ์ ๋ฌ๋์ ํต์ฌ ๊ฐ๋ ์ด๊ธฐ๋ ํ๋ค.
๐ก ๋จธ์ (๊ธฐ๊ณ, ์ปดํจํฐ) + ๋ฌ๋(ํ์ต)
๊ธฐ๊ณ(์ปดํจํฐ)๊ฐ ํ์ต(์ค์ค๋ก ๋ฐ์ดํฐ์ ๊ท์น์ ์ฐพ์๋ด๋)ํ๋ ๊ธฐ์
๋์ฒด ์ปดํจํฐ๊ฐ ์ด๋ป๊ฒ ์ค์ค๋ก ๋ฐ์ดํฐ๋ฅผ ์ฐพ๋ ๋ค๋ ๊ฒ์ผ๊น?
๋ณดํต์ ๊ฒฝ์ฐ "์ด๋ ํ ๊ท์น๊ณผ ์ผ์นํ๋ ๋ฐ์ดํฐ๋ฅผ ์ฐพ์๋ผ~" ๋ผ๋ ๋ช
๋ น์ ๊ฐ๋ฐ์๊ฐ ์ปดํจํฐ์๊ฒ ์ฝ๋ฉ์ผ๋ก ์ง์ํ๋ค.
ํ์ง๋ง ๋จธ์ ๋ฌ๋์ ํ๋ก๊ทธ๋๋จธ๊ฐ ์ด๋ค ๊ท์น์ ์ง์ ํด์ฃผ๋ ๊ฒ ์๋๋ผ, ์ปดํจํฐ๊ฐ ๊ท์น์ ์ฐพ๋ ๊ฒ์ด๋ค.
์๋ฅผ ๋ค์ด ์ดํด๋ณด์.
4์ 17์ผ์ ์์ ๊ฐ์๋์ด ๊ถ๊ธํ ๊ฒฝ์ฐ,
์ฐ๋ฆฌ๋ ์ง๋ ๋ ์จ์ ๋ฐ์ดํฐ๋ฅผ ๋ณด๊ณ ๋์ถฉ 4์ 17์ผ์ ๊ฐ์๋์ด ์ด๋จ ์ง ์์ํ ์ ์๋ค.
๋น๊ฐ ์๋ค ์์๋คํ๋ ์ด๋ค ํจํด(๊ท์น)์ ์ฐพ๋ ๊ฒ์ด๋ค.
์ธ๊ฐ์ด ์ด ๊ท์น์ ์ฐพ๊ธฐ์ ๋ฐ์ดํฐ๊ฐ ๋๋ฌด ๋ฐฉ๋ํ๊ณ ๋ง๊ธฐ ๋๋ฌธ์,
์ง๊ณ๋ฅผ ํ๊ณ ํจํด์ ์ฐพ๋๋ฐ ์ค์๊ฐ ์์ ์๋ ์๋ค.
๊ทธ๋์ ์ด ๊ณผ์ ์ ์ปดํจํฐ์๊ฒ ๋งก๊ฒจ๋ฒ๋ฆฐ ๊ธฐ์ ์ด ๋ฐ๋ก ๋จธ์ ๋ฌ๋์ด๋ค.
์ฆ, ํ๋ก๊ทธ๋๋จธ๋ ๊ท์น์ ์ง์ ํ๋๊ฒ ์๋๋ผ ์ปดํจํฐ๊ฐ ์ด๋ค ๊ท์น์ด๋ ํจํด์ ์ฐพ๊ฒ ํ๋ ์ฝ๋๋ฅผ ๊ตฌํํ๋ฉด ๋๋ ๊ฒ์ด๋ค.
์ด ํจํด์ด๋ ๊ท์น์ ์ฐพ๋ ๊ณผ์ ์ ์๊ณ ๋ฆฌ์ฆ ์ด๋ผ๊ณ ํ๋ค.
๐ก ์๊ณ ๋ฆฌ์ฆ
์ด๋ค ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์ ์ฐจ, ๋ฐฉ๋ฒ, ๋ช ๋ น์ด
(์ฐธ๊ณ ๋ก, ์ธ๊ณต์ ๊ฒฝ๋ง "์๊ณ ๋ฆฌ์ฆ"์ ์ฌ์ฉํ ๋ฐฉ์์ ๋ฐ๋ก ๋ฅ๋ฌ๋์ด๋ผ๊ณ ํ๋ค.)
ํ์ต์ ๋ํด ์์๋ณด์์ผ๋,
์ ์ด ํ์ต์ ๋ํด ์์๋ณด์.
์ ์ด ํ์ต(Transfer Leaning)์ด๋,
ํ ๋ถ์ผ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์ ์ป์ ์ง์๊ณผ ์ ๋ณด๋ฅผ ๋ค๋ฅธ ๋ฌธ์ ๋ฅผ ํธ๋๋ฐ ์ฌ์ฉํ๋ ๋ฐฉ์์ ๋งํ๋ค.
์๊น 'ํ์ต'์ด ๋ฐ์ดํฐ ์
์ ํตํด ์ด๋ ํ ๊ท์น์ ์ฐพ๋ ๊ธฐ์ ์ด๋ผ๊ณ ํ๋ค.
์ฆ, ํ์ต์ ์ํด์ ๋ฐฉ๋ํ ์์ ๋ฐ์ดํฐ๊ฐ ํ์ํ๋ฐ, ์ด๋ฅผ ํ ์ธ์ด๋ชจ๋ธ์ด ์ฒ์๋ถํฐ ํ์ตํ๋ ค๋ฉด
๋นํจ์จ ์ ์ด๊ธฐ ๋๋ฌธ์ ์ด๋ฏธ ํ๋ จ๋ ๋ชจ๋ธ์ ์ผ๋ถ๋ฅผ ๊ฐ์ ธ์ ์ ๋ชจ๋ธ์ ์ฌ์ฌ์ฉํ ๊ฒ์ ์๋ฏธํ๋ค.
์ด ํ๋ จ๋ ๋ชจ๋ธ์ Pre-training ๋ ๋ชจ๋ธ์ ์๋ฏธํ๋ค.
Pre-training ์ ๋ง ๊ทธ๋๋ก ์ฌ์ ํ๋ จ์ ์๋ฏธํ๋ค.
์ฌ์ ์ ๋ฐ์ดํฐ๋ก ๋ถํฐ ํ์ต์ ํ ๋ชจ๋ธ์ ๋ปํ๋ค.
๐ก ์ฐธ๊ณ
๋ฐ์ดํฐ๋ฅผ ๋๋์ผ๋ก ์ฌ์ฉํ์ฌ ํ์ต์ํจ ๋ชจ๋ธ์ LLM(Large Language Model) ์ด๋ผ๊ณ ํ๋ค.
๊ฒฐ๋ก !
GPT ๋ ์ ์ดํ์ต ๋ชจ๋ธ์ด๋ค.
์ฆ, ์ฌ์ ์ ํ๋ จ๋(Pre-trained) ๋ชจ๋ธ์ ์ฌ์ฌ์ฉ(Transfer learning)ํ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ชจ๋ธ์ด๋ค.
Generative Pre-trained Transformer.
๋ฐฉ๋ํ ์์ ๋ฐ์ดํฐ๋ฅผ ๋ฏธ๋ฆฌ ํ์ตํ์ฌ ์ด๋ฅธ ์์ฐ์ด ๋ฌธ์ฅ์ผ๋ก ์์ฑ(Generative) ํ๋ ๋ณํ๊ธฐ(๋ชจ๋ธ) ์ด๋ค.
์ฐธ๊ณ ๋ก, ์์ฑ(Generative) ์ด๋ผ๋ ์ฉ์ด์ ๋ํด ๋ถ์ฐ ์ค๋ช
์ ํ์๋ฉด
์์ฆ ๊ทธ๋ฆผ ๊ทธ๋ ค์ฃผ๋ AI, ๋จ์ด ์กฐํฉ์ผ๋ก ๋
ธ๋ ๋ง๋ค์ด์ฃผ๋ AI ๋ฑ ๋ฌด์ธ๊ฐ ์๋ก์ด ์ฝํ
์ธ ๋ฅผ
๋ง๋ค์ด๋ด๋ AI๋ฅผ Generative AI ๋ผ๊ณ ํ๋ค.
ChatGPT ์ญ์ ์์ฐ์ด์ธ ํ
์คํธ๋ฅผ ์์ฑํด๋ด๊ธฐ ๋๋ฌธ์ Gernerative AI ์ด๋ค.
๐ง GPT ์ ์ข ๋ฅ
GPT์๋ ์ฌ๋ฌ ์ข
๋ฅ๊ฐ ์๋ค.
GPT-3, GPT-3.5, ChatGPT ์ ๋๋ก ์ถ๋ ค๋ณผ ์ ์๋๋ฐ,
๊ฐ๊ฐ ์ด๋ค ์ฐจ์ด๊ฐ ์๋์ง ์์๋ณด์.
๐ ChatGPT
ChatGPT ๊ณต์ ์ค๋ช ๋ฌธ์์์ ChatGPT๋ GPT-3.5์ Fine-Tuned ๋ฒ์ ์ด๋ผ๊ณ ๋ช ์๋์ด ์๋ค.
Fine-Tuned ๋ ๋ฌด์์ผ๊น?
Fine-Tuned ๋ ํ์ต ๊ณผ์ ์ ๋ ์ด์ด ์ค ๊ฐ์ฅ ๋๋จ์ ๋ ์ด์ด๋ฅผ ๋ณํํ์ฌ ํ์ตํ๋ ๊ฒ์ด๋ค.
์ฌ๊ธฐ์ ๋ ์ด์ด๋ ๋ฌด์์ผ๊น?
๋ ์ด์ด๋ ์ฌ์ฌ์ฉํ ์ ์๊ณ ํ๋ จ ๊ฐ๋ฅํ ๋ณ์๋ฅผ ํฌํจํ๋ ์ํ์ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง ํจ์๋ฅผ ์๋ฏธํ๋ค.
์ฝ๊ฒ ์๊ธฐํ์๋ฉด ํจ์, ์ฆ, ์ด๋ค ์ ์ฐจ๋ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋๋ค.
์๋ฅผ ๋ค์ด ,
๊ฐ์ ๊ณ ์์ด ์ฌ์ง์ ๊ตฌ๋ถํ ์ ์๋ ์๊ณ ๋ฆฌ์ฆ์ด ์๋ค.
์ด ์๊ณ ๋ฆฌ์ฆ ๋ด์ ์ฌ๋ฌ ๋ ์ด์ด๊ฐ ์กด์ฌํ๊ณ ,
๊ฐ ๋ ์ด์ด๋ ํฌ๊ฒ
์ฌ์ง์ ํฝ์ ๋ค์ ๊ทธ๋ฃนํํ๋ ๋ ์ด์ด,
์ค๊ณฝ์ ์ธ์ํ๋ ๋ ์ด์ด,
์ด๋ค ๋๋ฌผ์ธ์ง ์ ์ถํ๋ ๋ ์ด์ด๊ฐ ์์ ๊ฒ์ด๋ค.
์ด ์๊ณ ๋ฆฌ์ฆ์์ ๊ฐ, ๊ณ ์์ด ๋ง๊ณ ๋ณ์๋ฆฌ๋ ์ธ์ํ๊ณ ์ถ์ ๋,
๋ค๋ฅธ ๋ ์ด์ด๋ ๊ฑด๋๋ฆด ํ์ ์์ด ๋๋จ ๋ ์ด์ด์ธ์ด๋ค ๋๋ฌผ์ธ์ง ์ ์ถํ๋ ๋ ์ด์ด ๋ถ๋ถ๋ง ์ด์ง ๋ณํ์์ผ์ฃผ๋ฉด ๋ ๊ฒ์ด๋ค.
์ด๋ฅผ ํ์ต ๊ณผ์ ์ ๋ ์ด์ด ์ค ๊ฐ์ฅ ๋๋จ์ ๋ ์ด์ด๋ฅผ ๋ณํํ์ฌ ํ์ตํ๋ Fine-Tuned ๋ฐฉ์์ด๋ค. ์ฆ, ChatGPT ๋ GPT-3.5์ ๋๋จ ๋ ์ด์ด๋ฅผ ๋ณํํด์ ํ์ต์ํจ ๋ชจ๋ธ์ธ ๊ฒ์ด๋ค.
๐ GPT-3.5
๊ทธ๋ ๋ค๋ฉด ChatGPT ์ ๊ธฐ๋ฐ์ด ๋ GPT-3.5 ๋ ๋ฌด์์ผ๊น?
๊ฐ๋จํ๋ค. GPT-3์ Fine-Tuned ๋ชจ๋ธ์ด๋ค.
InstructGPT ๋ผ๊ณ ๋ ๋ถ๋ฅธ๋ค. (์ ํํ๊ฒ๋ InstructGPT ์ ํ์ฅ๋ ๋ฒ์ ์ด GPT-3.5์ด๋ค)
๐ GPT-3
ChatGPT, GPT-3.5์ ๊ธฐ๋ฐ์ด ๋ ์ด GPT-3 ์
text ์ ๋ ฅ์ ๋ํด ๊ฐ์ฅ ์๋ง์ ๋ต๋ณ์ ๊ฒฐ๊ณผ๋ก ๋์ถํ๋ ๋ชจ๋ธ์ด๋ค.
text ๊ธฐ๋ฐ ๋ชจ๋ธ์ด๊ธฐ ๋๋ฌธ์ ๊ทธ๋ฆผ์ ๊ทธ๋ฆฌ๊ฑฐ๋ ์์ฑ์ ์ธ์ํ์ง ๋ชปํ๋ค.
๊ทธ๋ ๋ค๋ฉด ์ GPT-3 ๋ฅผ Fine-Tuned ํด์ ์ฌ์ฉํ๊ฒ ๋๊ฑธ๊น?
๋ฐ๋ก ์ํฉ๊ณผ ๋ชฉ์ ์ ์ ํฉํ AI๋ฅผ ๊ตฌํํ๊ธฐ ์ํด์ ์ด๋ค.
text ๊ธฐ๋ฐ์ด๋ผ๊ณ ํด์ text๊ฐ ๋ชจ๋ ๊ฐ์ ๊ฒ์ ์๋๋ค.
text์ ์ข ๋ฅ์๋ code ๋ ์์ ๊ฒ์ด๊ณ , ์ฐ๋ฆฌ๊ฐ ์๊ธฐํ๋ ์์ฐ์ด ์ผ ์๋ ์์ ๊ฒ์ด๋ค.
GPT-3์ ์์ฒญ๋ ํฌ๊ธฐ์ ํ์ต๋ฐ์ดํฐ์ด์ง๋ง ์ฑ๋ด์ฒ๋ผ ์ฌ์ฉ๋๊ธฐ์ ๋๋ฆฌ๊ณ ,
์ธ๊ฐ์ด ์ํ์ง ์๋ ๊ฒฐ๊ณผ(ํญ๋ ฅ์ /์ ์ ์ /์ํด/ํ์ค/์ฐจ๋ณ)๋ฅผ ๋์ถํด๋ผ ์ ์๊ธฐ ๋๋ฌธ์ ์ธ๊ฐ์ ์ํ ๊ฐํํ์ต์ด ํ์ํ๋ค.
์ด ํ์ต์ RLHF(Rainforcement Learning from Human Feedback) ๋ผ๊ณ ๋ถ๋ฅด๋๋ฐ, ์ด ๊ธฐ๋ฒ์ผ๋ก ํ์ต๋ ๊ฒ์ด GPT-3.5์ด๋ค.
ChatGPT ๋ RLHF ๊ธฐ๋ฒ์ ์ฌ์ฉํ์ฌ GPT-3.5๋ฅผ fine-tuned ํ ๋ชจ๋ธ์ด๋ค.
GPT-3.5 ์ ์ด์ง ๋ค๋ฅธ ์ ์ ์ข ๋ ์ธ๊ฐ ์นํ์ ์ธ ๋ํ๋ฅผ ํ ์ ์๋ค๋ ์ ์ด๋ค.
'์ด๋ ๊ฒ ๋งํ์ผ๋ฉด ์ ๋ ๊ฒ ๋๋ตํ๊ณ , ๊ทธ๋ผ ๋ ๊ทธ๋ ๊ฒ ๋งํ๊ฒ ์ง?' ๋ผ๊ณ ์๊ฐํ๋ฉฐ ๋๋ต์ ๋์ถํด๋ผ ์ ์๋๋ก ํ์ต์ ์์ผฐ๋ค.
์ด ๊ฐํ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ PPO(Proximal Policy Optimization) ์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค.
์ค์ ๋ก ๋ํ ํ์ ๋,
ChatGPT ๋ ๋ถ์ ์ ํ ์ง๋ฌธ์ ๋ํด ์์ ์ง๋ฌธ์ ์ฐจ๋จํ๋ ๋ชจ์ต์ ๋ณด์ธ๋ค.
๐ GPT-4
๊ทธ๋ฆฌ๊ณ ๊ฐ์ฅ ์ต๊ทผ์ธ 2023๋ 3์์ GPT-4 ๊ฐ ์ถ์๋์๋ค.
ChatGPT plus ์์ ์ ๋ฃ๋ก ์ฌ์ฉ ๊ฐ๋ฅํ๋ค.
์์ด ํํ ์ดํ์ธ ์คํฝ์ด๋ ๋ง์ดํฌ๋ก์ํํธ์ ์ ํ(Bing Chat ๋ฑ)์ ํ์ฌ๋์ด ์๋ค.
GPT-3.5 ์ ๊ฐ์ฅ ํฐ ์ฐจ์ด์ ์ ์ด๋ฏธ์ง ์ ์ถ๋ ฅ์ด ๊ฐ๋ฅํ๋ค๋ ์ ์ด๋ค.
์ด๋ฏธ์ง๋ฅผ ์ธ์ํ ์ ์๋๋ฐ, ์ด๋ฏธ์ง ๋ด์ ํ ์คํธ ๊น์ง๋ ์ธ์ ๊ฐ๋ฅํ๋ค๊ณ ํ๋ค.
๊ทธ๋ฆฌ๊ณ ์ข ๋ ์์ฐ์ด ์ฒ๋ฆฌ ๋ฅ๋ ฅ๋ ๋ฐ์ ํ๋ค.
์ด์ ์ ๋ป์ ์ดํดํด์ผํ๋ ๋ฐ๊น์ง ๊ตฌ์ฌํ๋ค๊ณ ํ๋ค.
AI ๊ฐ ์๊ฐ ๋ณด๋ค ํจ์ฌ ๋น ๋ฅธ ์๋๋ก ๋ฐ์ ๋๊ณ ์๋ค.
์์ง ๋ถ์์ ํ ๋ถ๋ถ๋ ์์ง๋ง, ๊ธ๋ฐฉ ๋ณด์๋ ๊ฒ ๊ฐ๋ค.
์ผ๋ง์ ์ WIS ์ ๋ฐฉ๋ฌธํ์๋๋ฐ, ์ ์ ์ ํ์ 8ํ ์ด AI ๊ด๋ จ ์ ํ์ด์๋ค. (๊ทธ ์ค GPT๋ฅผ ํ์ฉํ ์ ํ๋ ์์๋ค. )
๋ค์ณ์ง์ง ์์ผ๋ ค๋ฉด ์ด์ฌํ ๊ณต๋ถํด์ผ๊ฒ ๋ค!
์ด๋ฒ ํฌ์คํ ์์ ChatGPT์ ๋ํด ์์๋ณด์๋ค.
๋๊ธ, ํํธ, ํผ๋๋ฐฑ์ ์ธ์ ๋ ํ์์ ๋๋ค. ๐ฅฐ
https://www.zdnet.com/article/what-is-chatgpt-and-why-does-it-matter-heres-everything-you-need-to-know/
https://pseudo-lab.github.io/Tutorial-Book/chapters/NLP/Ch1-Introduction.html#gpt
https://hyjykelly.tistory.com/28
https://hyjykelly.tistory.com/27
https://www.tensorflow.org/js/tutorials/transfer/what_is_transfer_learning?hl=ko
https://velog.io/@easter423/GPT-3-vs-GPT-3.5-vs-ChatGPT#gpt-4