여기에 글 안 쓰려고 했는데, 함 와봤다가 알파고에 대한 오해가 너무 지나쳐서 기록을 남겨두고 싶어서.
알파고 수준을 카타고 28블럭 최신 버전 수준보다 높았을 거라고 믿는 애들 너무 많은데, 현실은?
18블럭 최종 뉴럴넷 50K 비짓으로 분석해보니까, 60수 시점에 이미 누적손실집수 10집을 넘겼다는 것.. 즉, 그만큼 실력 부족이 있었다는 것.
알파고가 18블럭을 뛰어넘기 때문에 18블럭으로 분석한 위 결과가 오류라고 주장할 수 있을 텐데,, 일정 부분 오차는 있을 수 있지만,
10블럭 최종 neuralnet + 1000K visits = 알파고가 둔 지점을 둠
28블럭 최종 neuralnet + 155K visits = 알파고가 둔 지점은 거의 쳐다도 안 봤고, 다른 수를 둠
반드시 이기려고 했을 가능성 높았던 1국부터 28블럭보다는 10블럭 수준과 비슷했을 거라는 이런 근거들을 계속 찾아낼 수 있음.
뉴럴넷별로 일치율 분석을 해봐도 6블럭과 10블럭에 가장 가깝고, 18블럭과는 가장 일치하지 않는다고 나옴.
당연히 28블럭과는 더 일치하지 않을 거고.
게다가,
알파고 분석해보다가 얘가 초반에 33을 뛰어들지 않는다는 것을 확인해서 대체 뉴널넷 어느 버전 즈음일지 조사해보니까, 위처럼
6b 040번째 뉴럴넷 (kata1-b6c96-s46949632-d6822967.txt.gz)
에서 알파고와 둔 수와 비슷해지는데,
6b 063번째 뉴럴넷 (kata1-b6c96-s175395328-d26788732.txt.gz)
에서는 33 뛰어듦.
즉, 6b 63번째 뉴럴넷도 33에 뛰어드는데, 알파고는 뛰어들지 않고 6b 40번째 뉴럴넷처럼 뒀기 때문에 6b 수준일 수도 있다는 말.
(물론, 알파고가 인간 기보로 학습해서 초반부터 33을 안 뛰어드는 것이기도 하지만.)
근거들은 더 많은데, 오늘 글의 그림 개수가 너무 많아서 다른 글에서 다시 정리하고, 여기까지의 요점은 뭐냐면,
알파고가 니들 추정처럼 28블럭 이상의 신급 능력이 아니라,
6b ~ 10b일 가능성이 높다는 수치논리적인 근거들이 위처럼 많으니까 쫌 쳐믿........을 리가 절대 읍찌 니들은ㅋㅋㅋㅋ
사실 이번 글은 위 주제가 아니고, 4국 78수에 대한 글.
알파고 4국 78수에 대해서
- 알파고가 78수에 대해서 정수로 받았다면, 수가 안 났을 거다.
- 버그로 인한 뽀록 승이었을 뿐이다.
- 구글 측이 봐준 거다.
- 알파고와 프로는 6점~7점 정도 차이 날 거다. (이세돌 대국 직후에 이런 말이 나왔으니까 여기에서 말한 프로는 이세돌급을 말한다고 봐야)
라는 말들을 하는 사람들 무척 많은데,
알파고와 프로는 6점~7점 정도 차이 날 거다. (이세돌 대국 직후에 이런 말이 나왔으니까 여기에서 말한 프로는 이세돌급을 말한다고 봐야)
→ 이 시점에 와서 katago와 프로들이 접바둑한 대국들 통계를 봐보니까 당시의 저런 말이 얼마나 개소리였는지 알 수 있을 거고.
버그로 인한 뽀록 승이었을 뿐이다.
→ 버그 발견 당시의 기술력으로 고칠 수 있는 코딩 실수를 버그라고 말하는 거고,
4국 때 나온 알파고 문제는 당장 고칠 수 없었기 때문에 버그가 아님.
왜 79수를 이상하게 뒀느냐?
카타고 10블럭 내외에서도 그렇게 둠. 즉, 버그가 아니라, 뉴럴넷이라는 기술 문제였다는 것.
왜 79수 이후에 너무 이상한 수들을 뒀느냐?
누군가는 그 수들을 보고 "버그 때문이다 or 구글이 봐줘서 저렇게 둔 거다"라고 생각했겠지만,
지평선 효과를 아는 사람들은 그 수들을 보자마자 "지평선 효과에 걸렸나보다"라고 생각했음.
구글 측이 봐준 거다.
→ 위에서 보여준 여러 근거들로 인해 알파고 수준이 삐꾸라서 그럴 가능성이 더 높음. 다른 근거들 더 모아서 언~~~젠가 올리겠음.
알파고가 다음 수를 정수로 받았다면, 수가 안 났을 거다.
→ 일단, 정수니 뭐니 그런 망상을 할 게 아니라, 그게 알파고 수준이었음을 먼저 인정해야 하고.
다만, 정수로 받았다면, 인공으로 돌려도 수가 날 가능성이 거의 0%에 가까운 건 사실이지만, 수가 나느냐 안 나느냐는 문제로만 국한해서 본다면,
알파고를 10b 수준으로 가정한다면 얘기가 달라짐.
그래서 알파고를 10b 수준으로 가정한다면, 이 글의 주제를 이렇게 바꿔볼 수 있음.
알파고가 79수를 정수로 뒀다면, 알파고 4국 80수 시점부터 알파고와 카타고 28b 50k가 서로 둬본다면 누가 이길까?
이 방식으로
"이미 알파고가 12집 내외 이기고 있던 상황에서
79수를 정수로 뒀다면
수가 안 나서
아무리 28블럭이더라도 50K visits로는
알파고의 12집 유리가 엎어지며 지는 경우는 절대로 발생하지 않는다."
는 주장을 검증해보겠다는 의도.
흑 = 알파고 = 카타고 10블럭 수준으로 가정 = 10블럭 뉴럴넷 최종 버전으로 가정 + 대부분 1000K visits로 돌렸음
백 = 78수를 증명해내려는 인공지능으로 가정 = 28블럭 뉴럴넷 최종 버전으로 가정 + 대부분 50K visits로 돌렸음
(28블럭은 3수 300K , 5수 150K , 나머지는 50K 이하)
백3은 내가 둔 것.
백3의 의도는 제대로 안 받으면, 상중앙에서 수를 내는 수를 보여주겠다는 의도였는데
뜬금 저래 받아서 깜놀.
백2도 내가 둔 것.
흑1이 왔으니까 원래는 그쪽 방향으로 대응하려 했는데, 백2는 10블럭 1000K가 추천한 수이고, 뭔가 함 시도해본 것.
인공이 저래 두는 걸 보고 백2 자리가 중요한갑다 싶었는데,
4국을 많이 분석해봐서 저런 수를 몇 년 전에 몇 번 봤었는데, 까먹고 있었음. 그래서 오랜만에 저 수를 보니까 신기.
처음에 86%였는데, 슬금슬금 내려오다가 이 때 81%로 줄었음.
상황이 뭔가 복잡해졌는데, 이 때까지 승률 81% 집차이+12집이었는데,
이건 sandbox에서 따로 28블럭 돌린 화면이야. (내가 쓰는 ogatak이라는 프로그램은 동시에 2개 못 돌려서 sandbox에서 한 것. 속도는 거의 비슷함.)
64K 밖에 돌리지 않았는데, 집 차이가 -5.0집으로 확 줄었음.
즉, 10b은 이전 수에서 이런 수들을 못 발견했던가, 간과했던가, 지평선효과로 인해 수를 지연시켜서 착각하고 있었던가 했을 거야.
10b은 여전히 별 문제 없다며 해맑으심.
이 때도 28b 수치 변화가 심해진 지점. 거의 다 왔다 느껴진 지점.
그래도 10b는 큰 타격은 입지 않은 것처럼 보이지만,
이 때 71%로 대폭 하락.
28b은 이 상황부터 역전.
이 시점 28b 6K 밖에 안 돌렸는데, 파란색 1순위 지점을 찾아냈는데, policy 값을 보니까 0.021로 무척 낮았는데도 찾아낸 것.
10b은 1000K나 돌렸는데도 28b이 1순위로 지목한 지점을 못 찾아냈음.
policy 값이 낮아서 그런가 싶었는데, 낮기는 하지만 다른 값들도 다들 낮아서 비교로 보면 낮다고만 볼 수 없거든.
1000K나 돌렸는데도 28b이 1순위로 지목한 지점에 2.5K 밖에 visits를 할당하지 않아서 다른 지점을 1순위로 지목했음.
10b도 역전됐음.
21% -9.7집까지 역전됨. 더 처참해지겠지만, 더 이상 안 봐도 승부는 결정된 게 거의 확실해서 여기까지. 사실 이미지도 50개 한계 다 찼음.
이 분석에서 알 수 있는 중요한 점들
1. 알파고 4국 78수 상황은 엄청나게 복잡한 상황이기 때문에 상상도 못했던 수들이 매복하고 있음. (위에 초반 그림에 나온 수가 그 예)
즉, 함부로 "78수는 안 되는 수다"라고 확정적으로 말해서는 안 되는 상황이라는 말.
2. 알파고 4국 78수 상황은 좌상귀 상중앙 우상귀 좌변 우변 하변 흑돌들이 크게 타격 받을 수도 있는 수들이 모두 존재함.
즉, 흑돌들이 약점이 많은 상황이었다는 것.
3. 28b 50K로도 알파고급으로 추정되는 10b 1000K를 잡아냈다는 점을 잊지 말아야 함.
인간도 10b 1000K를 이길 수 있을까? 일반적으로는 불가능. 근데, 10b의 한계를 이 분석에서 봤으니까 이세돌처럼 낚는 방법으로는 어쩌면 가능할 수도.
4. 안 좋은 상황을 상당히 늦게 인지하기도 함. 이 분석에서는 28b은 이미 결과 나온 걸 10b은 상당히 늦게 결과가 나왔음.
그래서 끝까지 진행해보지도 않고 "78수는 안 되는 수다"라고 함부로 말하지 말라는.
5. 위의 4의 이유는
상황이 안 좋아짐 → 손해가 되지만 → 반드시 받아야 하는 수를 → 추가시켜서 → 판단을 지연시켜서 → 착각하는 건데 → 여전히 해소 안 됨
이게 지평선 효과임. 알파고 4국 78수 이후에 알파고가 뒀던 이상한 손해수들의 이유임.
지평선 효과는 바둑보다는 장기에서 훨씬 쉽게 이해될 수 있음.
좌측 하위 노드들에서 3수 때에 외통이 되는 수를 베스트로 리턴 (즉, 위에서 말했던 것처럼 상황이 안 좋아졌다는 말)
→ 차로 사 먹어서 장군을 침 (즉, 위에서 말했던 것처럼 손해수를 뒀다는 말)
→ 궁으로 차를 먹음 (즉, 위에서 말했던 것처럼 반드시 받아야 하는 수라는 말)
→ 이로 인해 수순이 추가된 것 (즉, 위에서 말했던 것처럼 [차로 사를 친 수 + 궁으로 차를 먹은 수 = 2수] 추가됐다는 말)
→ 이로 인해 2수가 지연된 것 (즉, 위에서 말했던 것처럼 판단이 지연됐다는 말)
→ 차로 사를 먹은 1수 + 궁으로 사를 먹은 1수 + 나머지 1수 = 3수 이내에 외통 안 된 거라고 착각함
(즉, 위에서 말한 것처럼 위처럼 수를 지연시킨 게 착각이라는 말)
→ 위에서 2수를 지연시켰지만, 2수 지연시킨 후에도 여전히 3수 이내에 외통이 되는 상황은 해소 안 됨
(즉, 위에서 말한 것처럼 위처럼 맨 앞에서 나온 <상황이 안 좋아짐>의 상태가 해소되지 않고 여전히 유지된다는 말)
말 같지도 않은 수 같지만, 지평선 효과로 인한 이상한 수는 지극히 논리적인 수임.
인공과는 다르게 인간은 뇌 세포들이 거미줄처럼 얽혀 있어서 인공 같은 지평선 효과에 걸리지는 않지만, 종종 지평선 효과와 동일한 행위를 함.
"어? 상황 ㅈ돼서 이젠 외통이네. 디지기 전에 장이나 쳐보고 디지자!"
6. 이세돌이 4국에서 보여준 패턴은 <치명적인 지평선 효과 발생 상황으로 몰아가는 전형적인 패턴>이라서 엄청나게 대단한 대국을 한 것.
이세돌이 지평선 효과는 모를 테지만, 모양이 복잡해지면 인공의 수 읽기에 한계가 올 거라는 생각은 분명 한 것 같고, 그래서
손해를 보더라도 초반에는 수그린다 + 상대 모양이 약점이 있도록 유도한다 + 상대의 약점들이 서로 엮이게 유도한다 + 특정 시점 한 타에 때린다
3판 진 후에 심리적으로 엄청나게 쓰린 상황에서 직감으로 이런 작전을 구상했다는 건 대단한 거야.
2060으로 드럽게 시간 걸려서 5090 100개 묶어서 분석해보고 싶은. 4국은 너무너무 궁금함.
카타고 10블럭 수준이 어느정도인지 혹시 알아? 내가 세팅을 정확히 했는지는 모르지만, 예전에 내 컴퓨터로 몇판 실험해봤을 때, 카타고 10블럭이 엘프고보다는 약하기는 하지만, 그래도 20% 정도 승률은 거두었거든? 엘프고가 정상급 기사 상대로 한판도 안지고 몇십연승 거두는 실력인걸 감안했을 때, 님이 알파고가 10블럭 수준이라고 했으니까, 돌파고가 이미 그 정도 경지에 올라갔다는 이야기임? 물론 6블럭 수준이라고 하면, 더 수준은 낮아지겠지만
이세돌이 한판 이긴게 정말 기적인 수준이었던 건가?
이런 글 자주 써줘
재밌당..
글 너무좋은데 - dc App