Github๊ฐค ๋ฐ ์ˆ˜์ž˜๊ฐค์— ์˜›๋‚ ์—ย ์˜ฌ๋ ธ๋˜ ๊ฑด๋ฐ ๋จธ์‹ ๋Ÿฌ๋‹์˜ ์ด๋ก ์  ๊ธฐ์ดˆ๋ฅผ ์†Œ๊ฐœํ•˜๋Š” ๊ธ€์ž„.ย 


์†Œ์œ„ย Probably Approximately Correct (PAC) learning์ด๋ผ๊ณ  ๋ถ€๋ฅด๋Š” ์ด๋ก ์ธ๋ฐ,


ํ˜„์žฌ ์กด์žฌํ•˜๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๋ฐฉ๋ฒ•๋ก ๋“ค ๊ธฐ๋ฐ˜์„ ์ด๋ฃจ๋Š” ์ด๋ก ์ด๋ผ๊ณ  ๋ณด๋ฉด ๋จ. Theoretical computer science์—์„œ๋Š” ๋‚˜๋ฆ„ ์ค‘์š”ํ•œ ์ฃผ์ œ ์ค‘ ํ•˜๋‚˜์ž„.


์ผ๋‹จ ์•„๋ž˜์ฒ˜๋Ÿผ ์šฉ์–ด๋“ค์„ ์ •๋ฆฌํ•˜๊ณ 


viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73dec80fa11d028316f56ba15eaa5e1d2899cddb8daa53ba991f15764f25af0aaa9605a80cb1e21d7149ca6acad562b5f2c626f43082b1e24c7898faa8e



์šฉ์–ด๊ฐ€ ์ƒ์†Œํ•  ์ˆ˜๋„ ์žˆ์ง€๋งŒย X,Y๋Š” ๊ฐ๊ฐ ์‹ค์ œ ๋ฐ์ดํ„ฐ์˜ ์ง‘ํ•ฉ, ๋ ˆ์ด๋ธ” ์ง‘ํ•ฉ์ด๋ผ๊ณ  ๋ณด๋ฉด ๋˜๊ณ 


C๋Š” ์šฐ๋ฆฌ๊ฐ€ ์ฐพ๊ณ  ์‹ถ์€ ์™„๋ฒฝํ•œ ํ•จ์ˆ˜๋“ค c:X->Y์˜ ์ง‘ํ•ฉ,ย H๋Š” ์šฐ๋ฆฌ๊ฐ€ ์„ธ์šด ๊ฐ€์„ค์„ ํ†ตํ•ด์„œ (์˜ˆ๋ฅผ๋“ค์–ด ์„ ํ˜•ํšŒ๊ท€, ๋กœ์ง€์Šคํ‹ฑํšŒ๊ท€, ๋”ฅ๋Ÿฌ๋‹ etc) ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š” ํ•จ์ˆ˜๋“ค h:X->Yย ์˜ ์ง‘ํ•ฉ์ด๋ผ๊ณ  ๋ณด๋ฉด ๋จ.


๊ทธ๋Ÿผย ํ•™์Šต (learning)์ด๋ผ๋Š” ๊ฐœ๋…์„ ๋…ผ๋ฆฌ์ ์œผ๋กœ ์–ด๋–ป๊ฒŒ ์ •์˜ํ•  ์ˆ˜ ์žˆ์„๊นŒ?


๋‹จ์ˆœํ•œ ๋ฐฉ๋ฒ•์€ ์‹ค์ œ ๋ฐ์ดํ„ฐ X์— ๋Œ€ํ•ด ์˜ฌ๋ฐ”๋ฅธ ๋ ˆ์ด๋ธ”์„ ์ฐพ์„ ์ˆ˜ ์žˆ๋Š” ์™„๋ฒฝํ•œ ํ•จ์ˆ˜ ์ง‘ํ•ฉ C๋ฅผ ์ฐพ์œผ๋ฉด ๋จ.ย ์†Œ์œ„ย consistency learning์ด๋ผ๊ณ  ๋ถ€๋ฆ„.


๊ทธ๋Ÿผ ๋” ํฌ๋งํ•˜๊ฒŒย consistency learning์„ ์ •์˜ํ•ด๋ณด์ž.



viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73dec80fa11d028316f56ba15eaa5e1d2899cddb8daa53ba991f15764f25af0aaa9605a80cb1e21d7149ca6acad562b5f2c623a150f7b49741863e62a23


์œ„์˜ ์ •์˜๋ฅผ ์ด์šฉํ•ด์„œ ์™„๋ฒฝํ•œ ํ•จ์ˆ˜๋“ค์˜ ์ง‘ํ•ฉ C๊ฐ€ consistency model learnable ์ธ ๊ฒฝ์šฐ, ์šฐ๋ฆฌ๋Š” ํŠธ๋ ˆ์ด๋‹ ๋ฐ์ดํ„ฐ S์— ๋Œ€ํ•ด consistentํ•œ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ€์ง€๋Š” ๋ชจ๋ธ์„ ์ฐพ์„ ์ˆ˜ ์žˆ์Œ.


๋‹ค๋งŒ ์œ„์˜ consistency model๊ฐ€ ์œ ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์šฐ๋ฆฌ๋Š”ย ๋ชจ๋“  ๊ฒฝ์šฐ์˜ ์ˆ˜์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•ด์•ผํ•จ


๊ทธ๋ ‡์ง€ ์•Š๋‹ค๋ฉด ์ž‘์€ ํŠธ๋ ˆ์ด๋‹ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ consistency๋งŒ์„ ๊ฐ€์ •ํ•œ ๋ชจ๋ธ (๊ทธ๋ž˜์„œ consistency model์ž„)์ด๊ธฐ ๋•Œ๋ฌธ์—, ํŠธ๋ ˆ์ด๋‹ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ์™ธํ•œย unseen/test ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„  ์•„๋ฌด๊ฒƒ๋„ ์•Œ ์ˆ˜ ์—†์Œ.


ํ•˜์ง€๋งŒย ํ˜„์‹ค์—์„œ ์ด๋Ÿฌํ•œ ๊ฐ€์ •์€ ์‚ฌ์‹ค์ƒ ๋ง์ด ์•ˆ๋จ.


ํ˜„์‹ค์—์„œ๋Š” ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€์ง€๊ณ  ํŠธ๋ ˆ์ด๋‹ ํ•˜๋Š” ๊ฒฝ์šฐ๋Š” ๊ฑฐ์˜ ์—†๊ณ , ์šฐ๋ฆฌ๋Š” ์ฃผ์–ด์ง„ ํ•œ์ •๋œ ํŠธ๋ ˆ์ด๋‹ ๋ฐ์ดํ„ฐ๋กœ ๊ฐ€์„ค ์ง‘ํ•ฉ (ํŠน์ •ํ•œ ๋ชจ๋ธ๋“ค, ์„ ํ˜•ํšŒ๊ท€, ๋กœ์ง€์Šคํ‹ฑ, ๋“ฑ๋“ฑ)์—์„œ ํ•จ์ˆ˜ h๋ฅผ ์ฐพ์•„๋‚ด์•ผํ•จ.


๋‹ค์‹œ๋งํ•ด์„œ ์ฃผ์–ด์ง„ ํŠธ๋ ˆ์ด๋‹ ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ S๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ


๋ชจ๋ธ 1ย - ํŠธ๋ ˆ์ด๋‹ ์—๋Ÿฌ 0

๋ชจ๋ธ 2 -ย ํŠธ๋ ˆ์ด๋‹ ์—๋Ÿฌย 0

๋ชจ๋ธ 3 -ย ํŠธ๋ ˆ์ด๋‹ ์—๋Ÿฌย 0

๋ชจ๋ธ 4 -ย ํŠธ๋ ˆ์ด๋‹ ์—๋Ÿฌ 0.05


์ด๋Ÿฐ ๋ชจ๋ธ๋“ค์ด ์žˆ๋‹ค๊ณ  ์น˜์ž


์šฐ๋ฆฌ๋Š”ย consistency model๊ธฐ์ค€์œผ๋กœ๋Š”ย ๋ชจ๋ธ4๋Š”ย ๋ชจ๋ธ 1,2,3ย ๋ณด๋‹ค ์ข‹์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์Œ. ํ•˜์ง€๋งŒ consistency model์€ unseen/test data ์— ๋Œ€ํ•ด์„œ ์–ด๋– ํ•œ ์ •๋ณด๋„ ์ œ๊ณตํ•˜์ง€ ์•Š์Œ.


๊ทธ๋ ‡๋‹ค๋ฉด ์œ„์˜ย ๋ชจ๋ธ1, ๋ชจ๋ธ2, ๋ชจ๋ธ3ย ์€ unseen/test ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ๋„ ์™„๋ฒฝํ•˜๊ฒŒ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ์„๊นŒ?ย ๊ทธ๋ ‡์ง€ ์•Š๋‹ค๋ฉด ์šฐ๋ฆฌ๋Š” unseen data์— ๋Œ€ํ•ด์„œย ๋ชจ๋ธ1,2,3์˜ ์ผ๋ฐ˜ํ™” ์˜ค๋ฅ˜๋ฅผ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ์„๊นŒ?


Probably Approximately Correct learning์€ ์œ„์˜ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ํ•ด๋‹ต์„ ์œ„ํ•ด์„œ ๋งŒ๋“ค์–ด์ง„ ์ด๋ก ์ž„.



viewimage.php?id=2ab4c42ef0d0&no=24b0d769e1d32ca73cec80fa11d028312e15c0eaac8534358234c142d07d6488c1d0fbd5390a674cda932be42c0d031aef63a43f0acc72c427d528c6e0b341de



์œ„์˜ ์ •์˜๋ฅผ ๋ณด๋ฉด ์ผ๋ฐ˜ํ™” ์—๋Ÿฌ (unseen data์— ๋Œ€ํ•œ ์—๋Ÿฌ)๊ฐ€ ์ผ์ • ๊ธฐ์ค€ (epsilon) ์ด์ƒ์ผ ํ™•๋ฅ ์ด delta ๋ณด๋‹ค ๋‚ฎ์€ ๊ฒฝ์šฐ ์šฐ๋ฆฌ๋Š”ย PAC-learnable์ด๋ผ๊ณ  ์ •์˜ํ•  ์ˆ˜ ์žˆ์Œ.


์ฆ‰ ์™„๋ฒฝํ•œ ํ•จ์ˆ˜ c:X->Y์˜ ์ง‘ํ•ฉ C๊ฐ€ PAC-learnable์ด๋ฉด ์šฐ๋ฆฌ๊ฐ€ ์–ป์€ ํ•จ์ˆ˜ h๊ฐ€ Probably (ํ™•๋ฅ ์ ์œผ๋กœ) Approximately (๊ทผ์‚ฌ์ ์œผ๋กœ) Correct (์˜ฌ๋ฐ”๋ฅธ) ํ•จ์ˆ˜๋ผ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์Œ.


๋˜ํ•œ ์œ„์˜ ์ •์˜์—์„œ ๋ฐ”๋กœ PAC-learning์˜ ์ฃผ์š” ์ •๋ฆฌ ํ•˜๋‚˜๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋Š”๋ฐ



viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73dec80fa11d028316f56ba15eaa5e1d2899cddb8daa53ba991f15764f25af0aaa9605a80cb1e21d7149ca6acad562b5f2c3b6b475b7c4922c4bb70c4ba


viewimage.php?id=2ab4c42ef0d0&no=24b0d769e1d32ca73cec80fa11d028312e15c0eaac8534358234c142d07d6488c1d0fbd5390a674cda932be42c0d031aef63a43f549e739174872bc6e0b341de





์œ„์˜ ์ •๋ฆฌ๋ฅผ ์ด์šฉํ•˜๋ฉด ํŠธ๋ ˆ์ด๋‹ ๋ฐ์ดํ„ฐ์˜ ์ˆ˜, generalisation error ํŒŒ๋ผ๋ฉ”ํ„ฐ๋“ค (m, epsilon, delta) ์‚ฌ์ด์˜ ๊ด€๊ณ„๋ฅผ ์•Œ ์ˆ˜ ์žˆ์Œ.


์ฆ‰, ํŠธ๋ ˆ์ด๋‹ ๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ์•„์ง€๋ฉด ๋งŽ์•„์งˆ์ˆ˜๋ก exponentialํ•˜๊ฒŒ ๋ชจ๋ธ์˜ ์—๋Ÿฌ bound๊ฐ€ ์ข์•„์ง„๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์Œ.



๋‹ค๋งŒ, ์˜ˆ์‹œ์—์„œ ๋‚˜์˜จ ๊ฒƒ ์ฒ˜๋Ÿผ ์œ„์˜ PAC learning ์€ ํŠธ๋ ˆ์ด๋‹ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ ์™„๋ฒฝํ•œ (ํŠธ๋ ˆ์ด๋‹ ์—๋Ÿฌ 0) ๋ชจ๋ธ์„ ๊ฐ€์ •ํ•˜๊ณ  ์žˆ์Œ. ๊ทธ๋ ‡๋‹ค๋ฉด ํ˜„์‹ค์—์„œ ์ด๋Ÿฌํ•œ ์ผ€์ด์Šค๋ฅผ ์ฐพ์„ ์ˆ˜ ์—†๋Š” ๊ฒฝ์šฐ๋Š” ์–ด๋–จ๊นŒ? ๋‹ค์‹œ ๋งํ•ด ์œ„์˜ ์ด๋ก ์€ ์™„๋ฒฝํ•œ ํ•จ์ˆ˜์˜ ์ง‘ํ•ฉ C๊ฐ€ ๊ฐ€์„ค์ง‘ํ•ฉ H์˜ ๋ถ€๋ถ„์ง‘ํ•ฉ์ž„์„ ๊ฐ€์ •ํ•˜๊ณ  ์žˆ์Œ, ๋งŒ์•ฝ ๊ทธ๋ ‡์ง€ ์•Š๋‹ค๋ฉด?


๋˜ํ•œ ์œ„์˜ ์ •๋ฆฌ1.3์„ ๋ณด๋ฉด |H|, ์ฆ‰ ๊ฐ€์„ค์ง‘ํ•ฉ์ด ์œ ํ•œํ•ด์•ผํ•œ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์Œ. ๋งŒ์•ฝ ๊ฐ€์„ค์ง‘ํ•ฉ์ด ๋ฌดํ•œํ•œ ๊ฒฝ์šฐ์—๋„ PAC learning์„ ์ด์šฉํ•ด์„œ ์˜๋ฏธ์žˆ๋Š” generalisation bound๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์„๊นŒ?


์ฒซ๋ฒˆ์งธ ์งˆ๋ฌธ์€ย agnostic PAC learningย ์ด๋ก ์œผ๋กœ,ย ๋‘๋ฒˆ์งธ ์งˆ๋ฌธ์€ย Vapnik-Chervonenkis dimensionย ์œผ๋กœ ์ด์–ด์ง