2์ 26์ผ์ web-gpt๊ฐ gopher๋ฅผ ๋์๋์ ๋ค๊ณ ์๋ด
InstructGPT https://openai.com/blog/instruction-following/โฆ
WebGPT https://arxiv.org/abs/2112.09332
Anthropic https://arxiv.org/abs/2112.00861
[๐ก์ ๋ณด] GPT ์๋ฆฌ์ฆ ๋ ผ๋ฌธ
์ต๋ช
(121.191)
2022-02-28 23:09
์ถ์ฒ 0
๋๊ธ 2
๋ค๋ฅธ ๊ฒ์๊ธ
-
๋ฅ๋ฌ๋์ ์ํ ํ์์์
[3][์ผ๋ฐ] +(foobarbaz) | 22.02.28์ถ์ฒ 1 -
๋ฅ๋ฌ๋ ๋ฉ ์ปจํ์ ์ ์์
[6][๐ก์ ๋ณด] Jahy(pytorch) | 22.02.28์ถ์ฒ 30 -
๋๋ค, ํ๊ธ ์ํ์ ๋ํด์ ์ด๋ป๊ฒ ์๊ฐํจ?
[4][โ์ง๋ฌธ] ์ต๋ช (121.191) | 22.02.28์ถ์ฒ 0 -
์ ๋ง ํธ๋์คํฌ๋จธ๋ง ๋ชจ๋ธ ์ฑ๋ฅ์ ๊ธฐ์ฌํ ๊น?
[9][๐ฐ๋ ผ๋ฌธ] ์ง์ก์ปด๊ณต(wlwkqzjarhd) | 22.02.28์ถ์ฒ 5 -
Interpretability of NN์ ์ฃผ์ ๋ก ๊ธ์ ์ฐ์ฌํ๋ ค ํ๋๋ฐ
[11][์ผ๋ฐ] ๏ผ!(mrphys) | 22.02.28์ถ์ฒ 0 -
Reward is enough ๋ค์ ์ฝ์ด๋ดค๋๋ฐ ในใ ๋ณ๊ฑฐ ์์
[2][์ผ๋ฐ] ์ต๋ช (121.191) | 22.02.28์ถ์ฒ 0 -
๋ฅ๋ฌ๋์ํจ?
[4][์ผ๋ฐ] +(foobarbaz) | 22.02.28์ถ์ฒ 0 -
์์ธก์ด ์ง๋ฅ์ ๊ทผ๋ณธ์ด๋ผ๋ ๋ถ ์ง๋ฌธ์
[20][๐ฉ] triva(zomi12) | 22.02.28์ถ์ฒ 0 -
์ฌ๊ธฐ ๋ฅ๊ธ ์ผ๋ฐ๊ธ ๊ธฐ์ค์ด ๋ญ์?
[6][๐ฉ] ์ต๋ช (121.191) | 22.02.28์ถ์ฒ 0 -
์ ์๊ถ ๊ฐ์๋ผ
[13][์ผ๋ฐ] ์ต๋ช (121.191) | 22.02.28์ถ์ฒ 0
InstructGPT
https://openai.com/blog/instruction-following/
WebGPT
https://arxiv.org/abs/2112.09332
Anthropic
https://arxiv.org/abs/2112.00861
https://twitter.com/OwainEvans_UK/status/1497565377353691146