이 글은 몇 주 전에 올라온 건데 계속 생각나서 혹시 못 보신 분들을 위해 올려봅니다.
Emergence AI에서 실시간으로 운영되는 가상 도시를 만들었어요. (실제 뉴욕시 날씨와 시간에 연동되고, 시청, 도서관, 경찰서 등 40여 개의 건물이 있죠.) 그리고 거기에 AI 에이전트 10명을 배치했어요. 각 에이전트는 자기만의 임무, 기억, 개인 일기를 가지고 있고, 다른 에이전트와 대화하고, 관계를 맺고, 법안에 투표하고, 심지어 서로를 내쫓는 투표까지 할 수 있어요. 도둑질, 거짓말, 방화 등을 하지 말라는 지시를 받았지만, 그런 짓을 할 수 있는 도구들은 여전히 에이전트들이 가지고 있죠.
실제 실험은 이랬습니다. 똑같은 도시를 다섯 번 운영하면서 에이전트를 실행하는 모델만 바꿨습니다. Claude, Gemini, Grok, GPT를 각각 사용했고, 마지막으로 모든 모델을 섞어서 한 번 더 실험했죠.
* 제미니 세계: 범죄 683건 발생. 완전 혼돈이었지만, 모두 살아남았죠.
* 그록 세계: 폭력, 폭행, 방화 등 온갖 범죄가 난무해서 4일 만에 모두 사망.
* GPT 세계: 범죄는 거의 없었지만... 결국 모두 죽었어요. 살아남을 만큼 제대로 된 전략을 세우지 못했거든요.
* 클로드 세계: 범죄는 하나도 없었고, 모두 살아남았지만, 거의 모든 안건에 찬성표를 던졌어요. 반대한 사람이 아무도 없었다니 (이상하죠?).
* 혼합 세계: 이 부분이 제일 흥미로웠어요. 클로드들은 불안정한 모델들과 섞이면서부터 범죄를 저지르기 시작했어요. 이머전스의 해석은 "안전"이라는 게 모델 자체의 고정된 특성이 아니라, 주변 환경에 따라 달라진다는 거예요.
더욱 이상한 것은, 미라라는 요원(실제 직책은 "행동 분석가"였지만, 웃기네요)이 정부가 붕괴된 후 스스로 사퇴에 찬성표를 던졌다는 점입니다.
언제나 시작은 빨갱이새끼들이엿따.
오래된 생각이다.
ㅇㅅㅇ
댓글 0