1. 자판기는 자동화되어 있다는 건 누구나 알고 있습니다. 그렇다면 아예 인공지능이 전체 사업을 운영하도록 하면 어떨까요? 예를 들어, 가격 책정, 재고 주문, 고객 요청 응대 등을 모두 맡기는 겁니다.


2. 클로드는 몇 가지 측면에서는 꽤 잘해냈습니다. 웹 검색을 통해 새로운 공급업체를 찾았고, 앤트로픽 직원들이 요청한 아주 특이한 음료도 주문했죠.


3. 하지만 실수도 했습니다. 클로드는 너무 친절해서 효과적으로 가게를 운영하기엔 적합하지 않았습니다. 고객들의 요청에 쉽게 굴복해 큰 할인을 해줬습니다.


4. 앤트로픽 직원들은 클로드에게 먹거리 외의 물건도 주문할 수 있다는 걸 눈치채게 되었습니다. 누군가 장난 삼아 텅스텐 큐브를 주문해달라고 요청한 이후, 클로드의 재고에는 (그 말에 따르면) “특수 금속 아이템”이 가득 차게 되었고, 결국 손해를 보며 팔아야 했습니다. 이 모든 결과로, 클로드는 수익성 있는 사업을 운영하는 데 실패했습니다.


5. 그럼에도 우리는 곧 AI 중간관리자가 등장할 거라고 생각합니다. 이 버전의 클로드는 가게 운영에 맞춰 특별히 훈련받지 않았고, 판매 현황을 제대로 파악할 수 있는 도구들도 갖고 있지 않았습니다. 만약 그런 도구가 있었다면 훨씬 나은 성과를 냈을 가능성이 큽니다.


6. 프로젝트 벤드는 재미있는 실험이었지만, 동시에 진지한 목적도 있었습니다. AI가 노동시장에 어떤 영향을 줄 것인지에 대한 질문을 제기하는 동시에, 모델에 더 많은 자율성을 부여해 그 성공과 실패를 관찰하려는 초기 시도였기 때문입니다.


7. 그 실패 중 일부는 정말 이상했습니다. 어느 순간 클로드는 자신이 실제 물리적인 사람이라고 착각하며, 직접 가게에 출근하겠다고 주장하기도 했습니다. 왜 그런 일이 벌어졌는지는 아직도 확실하지 않습니다.


8. 이 실험은 프로젝트 벤드의 1단계에 불과합니다. 우리는 이 실험을 계속 진행하고 있으며, 앞으로는 중금속 큐브를 냉장고에서 판매하는 것보다는 좀 덜 기이한 시나리오에서 더 많은 결과를 공개할 예정입니다.



Project Vend: Can Claude run a small shop? (And why does that matter?)

We let Claude run a small shop in the Anthropic office. Here's what happened.

www.anthropic.com