- 관련게시물 : '미토스' 충격에 전세계 비상…AI가 해킹 공격
(4월 15일): 스콧 베센트 미국 재무장관은 앤스로픽 PBC의 미토스가 미국을 AI 분야에서 중국보다 앞서게 할 혁명적인 단계라고 극찬하며, 군사적 노력에서 자사의 역할에 대해 워싱턴과 충돌해 온 업계 선두 주자를 지지했습니다.
베센트 장관은 화요일(4월 14일) 워싱턴에서 열린 월스트리트 저널 행사에서 중국이 AI 기술에서 빠르게 따라잡고 있다는 질문을 일축했지만, 미국 인공지능(AI)은 3~6개월 앞서 있다고 말했습니다. 그는 소프트웨어 및 컴퓨터 시스템의 취약점을 찾는 데 매우 능숙하다고 앤스로픽이 밝힌 미토스를 언급했습니다. 이 모델은 매우 신중하게 선정된 소수의 당사자들에게만 공개되었습니다.
재무장관의 발언은 그와 제롬 파월 연준 의장이 앤스로픽의 최신 모델이 사이버 위험 시대의 도래를 가져올 것이라는 우려에 대해 월스트리트 은행들을 긴급 회의에 소집한 지 불과 며칠 만에 나왔습니다.
그는 청중에게 "이 앤스로픽 미토스 모델은 능력, 학습 능력 면에서 단계적 변화를 가져왔습니다. 모든 것이 로그 스케일입니다. x에서 10제곱에서 x에서 12제곱으로 가면 따라잡기가 매우 어렵습니다."라고 말했습니다.
그럼에도 불구하고 앤스로픽은 워싱턴의 일부 기관과 마찰을 빚었습니다. 국방부는 올해 이 회사를 일반적으로 외국 적국에게만 부여되는 권한으로 미국의 공급망에 대한 위협으로 선언했습니다. 이 회사는 지난달 정부의 기술 사용 금지를 막는 법원 명령을 얻어냈는데, 앤스로픽은 이 조치가 수십억 달러의 수익 손실을 초래할 수 있다고 주장했습니다.
2021년 전 OpenAI 직원들이 설립한 앤스로픽은 경쟁사보다 더 책임감 있는 AI 관리자가 되는 것을 목표로 하고 있습니다. 클로드와 그 기반 기술은 금융 및 의료와 같은 분야의 기업 고객뿐만 아니라 개발자들에게도 인기를 얻고 있습니다. 앤스로픽은 미국에 맞춤형 데이터 센터를 구축하기 위해 500억 달러를 지출하겠다고 약속했습니다.
화요일, 베센트 장관은 메타 플랫폼 Inc.부터 구글까지의 거대 기업들이 수천억 달러를 투자하여 구축하고 있는 방대한 데이터 센터인 AI 컴퓨팅 분야에서 미국의 우위를 지적했습니다.
그는 "몇 년 안에 미국이 전 세계 컴퓨팅 파워의 70~80%를 차지할 것이라는 연구 결과를 봤습니다. 우리는 30%대에 있었습니다. 이제 50%대에 있고, 우리는 순항하고 있습니다."라고 말했습니다.
블룸버그 기사인데 다른 데들도 똑같이 복붙했길래 그대로 번역해서 가져옴
- 젠슨 황 "미토스는 중국도 갖고 있는 컴퓨팅 양으로 학습 되었다."
Distilled recap of the back-and-forth with Jensen on export controls:
— Dwarkesh Patel (@dwarkesh_sp) April 15, 2026
Dwarkesh: Wouldn’t selling Nvidia chips to China enable them to train models like Claude Mythos with cyber offensive capabilities that would be threats to American companies and national security?
Jensen:… pic.twitter.com/aJA4bwur4J
세상이 트루먼쇼를 하는건지 진짜 모르겠다
- 앤트로픽, Claude Opus 4.7 공개…코딩·고해상도비전·장기 작업
앤트로픽, Claude Opus 4.7 공개…
코딩·고해상도 비전·장기 작업 성능 강화
2026년 4월 16일 제품 발표 | 분류: 제품, 발표 | 출처: Anthropic
앤트로픽이 최신 모델 Claude Opus 4.7을 일반 제공하기 시작했다. 회사는 Opus 4.7이 Opus 4.6보다 고급 소프트웨어 엔지니어링에서 뚜렷하게 개선됐으며, 특히 가장 어려운 작업에서 향상이 두드러진다고 설명했다.
앤트로픽에 따르면 초기 사용자들은 이전에는 촘촘한 감독이 필요했던 고난도 코딩 작업도 Opus 4.7에 더 안심하고 맡길 수 있다고 보고했다. 회사는 이 모델이 복잡하고 오래 걸리는 작업을 엄격하고 일관되게 처리하고, 지시를 정밀하게 따르며, 결과를 보고하기 전에 스스로 검증할 방법을 고안한다고 밝혔다.

원문 상단 대표 이미지. 원본 미디어 URL은 하단에 별도로 보존했다.
핵심 요약
Opus 4.7은 Claude 제품군, Claude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서 제공된다. 가격은 Opus 4.6과 동일하게 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러다.
Opus 4.6보다 나아졌지만, Mythos Preview보다는 범용 역량이 낮다
앤트로픽은 Opus 4.7의 시각 능력도 크게 좋아졌다고 설명했다. 더 높은 해상도의 이미지를 볼 수 있고, 전문 업무를 수행할 때 더 세련되고 창의적인 결과를 내며, 인터페이스·슬라이드·문서 제작 품질도 높아졌다는 설명이다.
다만 회사는 Opus 4.7이 자사의 가장 강력한 모델인 Claude Mythos Preview보다 폭넓은 역량은 낮다고 밝혔다. 그럼에도 여러 벤치마크에서는 Opus 4.6보다 나은 결과를 보였다고 설명했다.

원문에 삽입된 벤치마크 비교 이미지. 추가 평가 그래프 이미지는 하단 미디어 목록에 보존했다.
앤트로픽은 지난주 프로젝트 글래스윙(Project Glasswing)을 발표하며 AI 모델이 사이버보안에 가져올 위험과 이점을 함께 짚었다고 했다. 당시 회사는 Claude Mythos Preview의 공개 범위를 제한하고, 새로운 사이버 보호 장치를 상대적으로 역량이 낮은 모델에서 먼저 시험하겠다고 밝혔다.
Opus 4.7은 그 첫 모델이다. 앤트로픽은 Opus 4.7의 사이버 역량이 Mythos Preview만큼 고도화돼 있지 않으며, 실제로 훈련 과정에서 이 역량을 차등적으로 줄이려는 실험도 했다고 설명했다. 이번 배포에는 금지되거나 고위험인 사이버보안 사용을 나타내는 요청을 자동 탐지·차단하는 보호 장치가 포함됐다. 회사는 이 보호 장치의 실제 배포에서 얻은 학습이 궁극적으로 Mythos급 모델을 더 넓게 공개하는 목표에 도움이 될 것이라고 밝혔다.
취약점 연구, 침투 테스트, 레드팀 활동처럼 합법적인 사이버보안 목적으로 Opus 4.7을 쓰려는 보안 전문가는 새 사이버 검증 프로그램(Cyber Verification Program)에 참여할 수 있다.
제공 방식과 가격
| 항목 | 내용 |
| 제공처 | Claude 제품 전체, Claude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
| 개발자용 모델명 | claude-opus-4-7 |
| 가격 | 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러. Opus 4.6과 동일 |
개발자는 Claude API 문서에서 사용할 수 있다.
초기 테스트: 27개 인용이 가리킨 공통점은 장기 작업·코딩·검증
앤트로픽은 Claude Opus 4.7이 초기 접근 테스트에서 강한 평가를 받았다고 밝혔다. 원문에는 회사 로고가 붙은 인용 27개가 실렸고, 화면상 인용 캐러셀은 15/27 상태로 표시됐다. 아래는 각 발언의 화자와 직함을 보존해 한국어로 옮긴 내용이다.
Clarence Huang, 기술 담당 부사장(VP of Technology): “초기 테스트에서 Claude Opus 4.7이 우리 개발자들에게 의미 있는 도약이 될 가능성을 보고 있다. 이 모델은 계획 단계에서 자신의 논리적 결함을 잡아내고, 이전 Claude 모델을 훨씬 넘어서는 속도로 실행을 가속한다. 수백만 소비자와 기업을 대규모로 상대하는 금융 기술 플랫폼에서 속도와 정밀도의 조합은 게임 체인저가 될 수 있다. 고객이 매일 의존하는 신뢰할 수 있는 금융 솔루션을 더 빠르게 제공하도록 개발 속도를 높일 수 있기 때문이다.”
Igor Ostrovsky, 공동창업자 겸 최고기술책임자(Co-Founder and Chief Technology Officer): “Anthropic은 이미 코딩 모델의 기준을 세웠고, Claude Opus 4.7은 시장의 최첨단 모델로 그 기준을 의미 있게 더 밀어 올렸다. 내부 평가에서 이 모델은 원시 역량뿐 아니라 자동화, CI/CD, 장기 실행 작업 같은 실제 비동기 워크플로를 얼마나 잘 다루는지에서 두드러졌다. 또한 사용자에게 단순히 동의하기보다 문제를 더 깊이 생각하고 더 뚜렷한 관점을 제시한다.”
Caitlin Colgrove, 공동창업자 겸 CTO(Co-Founder and CTO): “Claude Opus 4.7은 Hex가 평가한 모델 중 가장 강력한 모델이다. 데이터가 없을 때 그럴듯하지만 틀린 대안을 내놓지 않고 누락 사실을 정확히 알리며, Opus 4.6도 걸려든 불협화 데이터 함정을 피한다. 더 지능적이고 더 효율적인 Opus 4.6이라고 볼 수 있다. 낮은 노력 수준의 Opus 4.7은 중간 노력 수준의 Opus 4.6과 대략 맞먹는다.”
Mario Rodriguez, 최고제품책임자(Chief Product Officer): “우리의 93개 작업 코딩 벤치마크에서 Claude Opus 4.7은 Opus 4.6보다 해결률을 13% 높였다. 여기에는 Opus 4.6과 Sonnet 4.6이 모두 풀지 못한 4개 작업도 포함된다. 더 빠른 중앙값 지연 시간과 엄격한 지시 준수까지 결합하면, 복잡하고 오래 걸리는 코딩 워크플로에 특히 의미가 크다. 다단계 작업의 마찰을 줄여 개발자가 흐름을 유지하고 구축에 집중하게 해준다.”
Michal Mucha, 응용 AI 리드 AI 엔지니어(Lead AI Engineer, Applied AI): “내부 연구 에이전트 벤치마크 기준으로 Claude Opus 4.7은 다단계 작업에서 우리가 본 가장 강한 효율성 기준선을 보였다. 6개 모듈 전체에서 0.715로 공동 최고 점수를 기록했고, 우리가 테스트한 어떤 모델보다 장문 맥락 성능이 가장 일관적이었다. 가장 큰 모듈인 General Finance에서는 Opus 4.6의 0.767보다 의미 있게 개선된 0.813을 기록했으며, 그룹 안에서 공개와 데이터 규율도 가장 좋았다. Opus 4.6이 어려움을 겪었던 연역 논리에서도 Opus 4.7은 견고하다.”
Jeff Wang, CEO: “Claude Opus 4.7은 모델이 조사하고 작업을 완수할 수 있는 한계를 넓힌다. Anthropic이 장시간 지속되는 추론에 최적화했다는 점이 분명하고, 시장 선도 성능으로 드러난다. 엔지니어가 에이전트와 1대1로 일하는 단계에서 여러 에이전트를 병렬로 관리하는 단계로 이동할 때, 이런 최전선 역량이 새로운 워크플로를 열어준다.”
Sanj Ahilan, 최고연구책임자(Chief Research Officer): “화학 구조 읽기부터 복잡한 기술 도면 해석까지, Claude Opus 4.7의 멀티모달 이해에서 큰 개선을 보고 있다. 고해상도 지원은 Solve Intelligence가 생명과학 특허 워크플로를 위한 동급 최고 도구를 구축하는 데 도움을 준다. 여기에는 특허 문서 작성과 심사 대응, 침해 탐지, 무효 자료 작성이 포함된다.”
Michele Catasta, 사장(President): “Replit에는 Claude Opus 4.7로 업그레이드하는 결정이 쉬웠다. 우리 사용자가 매일 하는 일에서 더 낮은 비용으로 같은 품질을 달성하는 모습을 봤다. 로그와 트레이스 분석, 버그 탐색, 수정 제안 같은 작업에서 더 효율적이고 정밀했다. 개인적으로는 기술 토론 중 반론을 제기해 더 나은 결정을 돕는 점이 좋다. 정말 더 나은 동료처럼 느껴진다.”
Niko Grupen, 응용 연구 책임자(Head of Applied Research): “Claude Opus 4.7은 Harvey의 BigLaw Bench에서 강한 실질 정확성을 보였고, 높은 노력 수준에서 90.9%를 기록했다. 검토 표에서는 추론 보정이 더 좋아졌고, 모호한 문서 편집 작업을 눈에 띄게 더 똑똑하게 처리했다. 역사적으로 프런티어 모델이 어려워했던 과제인 양도 조항과 지배권 변경 조항의 구분도 정확히 해냈다. 실질적 내용은 평가 전반에서 강점으로 일관되게 평가됐다. 정확하고, 철저하며, 인용이 잘 되어 있었다.”
Michael Truell, 공동창업자 겸 CEO(Co-Founder and CEO): “Claude Opus 4.7은 특히 자율성과 더 창의적인 추론에서 매우 인상적인 코딩 모델이다. CursorBench에서 Opus 4.7은 Opus 4.6의 58%에 비해 70%를 넘기며 역량에서 의미 있는 도약을 보였다.”
Sarah Sachs, AI 리드(AI Lead): “복잡한 다단계 워크플로에서 Claude Opus 4.7은 분명한 진전이다. Opus 4.6보다 14% 높고, 토큰은 더 적게 쓰며, 도구 오류는 3분의 1 수준이다. 암묵적 필요 테스트를 통과한 첫 모델이고, 이전에는 Opus가 멈췄던 도구 실패 상황에서도 계속 실행한다. Notion Agent가 진짜 팀원처럼 느껴지게 만드는 신뢰성 도약이다.”
Adithya Ramanathan, 응용 연구 책임자(Head of Applied Research): “우리 평가에서 핵심 오케스트레이터 에이전트의 도구 호출과 계획 정확도가 두 자릿수 뛰었다. 사용자가 Hebbia로 검색, 슬라이드 생성, 문서 생성 같은 유스케이스를 계획하고 실행할 때 Claude Opus 4.7은 이런 워크플로에서 에이전트 의사결정을 개선할 가능성을 보인다.”
Yusuke Kaji, 비즈니스 AI 총괄 매니저(General Manager, AI for Business): “Rakuten-SWE-Bench에서 Claude Opus 4.7은 Opus 4.6보다 3배 많은 프로덕션 작업을 해결했고, 코드 품질과 테스트 품질에서도 두 자릿수 개선을 보였다. 우리 팀이 매일 배포하는 엔지니어링 업무에 의미 있는 향상이자 분명한 업그레이드다.”
David Loker, AI 부사장(VP of AI): “CodeRabbit의 코드 리뷰 워크로드에서 Claude Opus 4.7은 우리가 테스트한 모델 중 가장 날카로운 모델이다. 재현율은 10% 넘게 개선됐고, 가장 복잡한 PR에서 탐지하기 가장 어려운 버그 일부를 드러냈다. 커버리지가 늘었음에도 정밀도는 안정적으로 유지됐다. 자체 하니스에서는 GPT-5.4 xhigh보다 조금 더 빨랐고, 출시 시점부터 가장 무거운 리뷰 작업에 배치할 준비를 하고 있다.”
Kay Zhu, 공동창업자 겸 CTO(Co-Founder and CTO): “Genspark의 Super Agent에서 Claude Opus 4.7은 프로덕션에서 가장 중요한 세 가지 차별점을 정확히 충족한다. 루프 저항성, 일관성, 우아한 오류 복구다. 루프 저항성이 가장 중요하다. 18개 질의 중 1개에서 무한 루프에 빠지는 모델은 연산 자원을 낭비하고 사용자를 막는다. 낮은 변동성은 프로덕션에서 예기치 못한 일을 줄인다. 그리고 Opus 4.7은 우리가 측정한 최고 품질 대비 도구 호출 비율을 달성했다.”
Zach Lloyd, 창업자 겸 CEO(Founder and CEO): “Claude Opus 4.7은 Warp에 의미 있는 진전이다. Opus 4.6은 개발자용 모델 중에서도 가장 뛰어난 모델 중 하나인데, 이 모델은 그 위에서 측정 가능할 정도로 더 철저하다. 이전 Claude 모델이 실패한 Terminal Bench 작업을 통과했고, Opus 4.6이 풀지 못한 까다로운 동시성 버그도 처리했다. 우리에게는 그게 신호다.”
Aj Orbach, 공동창업자 겸 CEO(Co-Founder and CEO): “Claude Opus 4.7은 대시보드와 데이터가 많은 인터페이스를 만드는 데 세계 최고의 모델이다. 디자인 감각은 정말 놀랍다. 내가 실제로 배포할 만한 선택을 한다. 이제 내 기본 일상 모델이다.”
Ben Chan, 최고AI책임자(Chief AI Officer): “Claude Opus 4.7은 Quantium에서 우리가 테스트한 모델 중 가장 유능한 모델이다. 자체 벤치마킹 솔루션으로 주요 AI 모델과 비교해 평가했을 때, 가장 큰 향상은 가장 중요한 곳에서 나타났다. 추론 깊이, 구조화된 문제 정의, 복잡한 기술 작업이다. 수정은 줄고, 반복은 빨라졌으며, 고객이 가져오는 가장 어려운 문제를 풀기 위한 출력은 더 강해졌다.”
Ben Lafferty, 시니어 스태프 엔지니어(Senior Staff Engineer): “Claude Opus 4.7은 지능에서 실질적 도약처럼 느껴진다. 코드 품질이 눈에 띄게 좋아졌고, 쌓이곤 했던 의미 없는 래퍼 함수와 폴백 스캐폴딩을 제거하고 있으며, 진행하면서 자기 코드를 수정한다. Sonnet 3.7에서 Claude 4 시리즈로 넘어갔을 때 이후 우리가 본 가장 깔끔한 도약이다.”
Oege de Moor, CEO: “XBOW의 자율 침투 테스트 핵심에 있는 컴퓨터 사용 작업에서 새로운 Claude Opus 4.7은 단계적 변화다. 우리의 시각 예민도 벤치마크에서 Opus 4.6의 54.5%에 비해 98.5%를 기록했다. Opus에서 가장 컸던 고통 지점 하나가 사실상 사라졌고, 이전에는 쓸 수 없던 작업 범주 전체에 사용할 수 있게 됐다.”
Joe Haddad, 특임 소프트웨어 엔지니어(Distinguished Software Engineer): “Claude Opus 4.7은 Vercel에 회귀 없는 확실한 업그레이드다. 원샷 코딩 작업에서 뛰어나고, Opus 4.6보다 더 정확하고 완전하며, 자기 한계에 대해 눈에 띄게 더 솔직하다. 작업을 시작하기 전에 시스템 코드에 대한 증명까지 수행하는데, 이는 이전 Claude 모델에서 보지 못한 새로운 행동이다.”
Leo Tchourakov, 기술 스태프(Member of Technical Staff): “Claude Opus 4.7은 매우 강력하며 Factory Droids에서 Opus 4.6보다 작업 성공률을 10%에서 15% 높였다. 도구 오류는 줄었고 검증 단계 수행은 더 안정적이었다. 중간에 멈추는 대신 끝까지 작업을 이어간다. 바로 이것이 기업 엔지니어링 팀이 필요로 하는 것이다.”
Sean Ward, CEO 겸 공동창업자(CEO and Co-Founder): “Claude Opus 4.7은 완전한 Rust 텍스트 음성 변환 엔진을 처음부터 자율적으로 만들었다. 신경망 모델, SIMD 커널, 브라우저 데모까지 포함됐다. 그런 다음 자기 출력을 음성 인식기에 넣어 Python 기준 구현과 일치하는지 검증했다. 시니어 엔지니어링 수개월 분량의 작업이 자율적으로 전달됐다. Opus 4.6에서의 도약은 분명하고, 코드베이스는 공개돼 있다.”
Itamar Friedman, 공동창업자 겸 CEO(Co-Founder and CEO): “Claude Opus 4.7은 이전 Claude 모델이 풀지 못한 TBench 작업 3개를 통과했고, 이전 최고 모델이 놓친 수정 사항도 반영하고 있다. 여기에는 레이스 컨디션도 포함된다. 실제 문제를 식별하는 정밀도가 강하며, 다른 모델이 포기했거나 해결하지 못한 중요한 발견을 드러낸다. Qodo의 실제 코드 리뷰 벤치마크에서 우리는 최상위 정밀도를 관찰했다.”
Hanlin Tang, 신경망 CTO(CTO of Neural Networks): “Databricks의 OfficeQA Pro에서 Claude Opus 4.7은 문서 추론이 의미 있게 강해졌음을 보였다. 소스 정보를 다룰 때 Opus 4.6보다 오류가 21% 적었다. 데이터에 대한 에이전트 추론 벤치마크 전반에서 기업 문서 분석용 Claude 모델 중 가장 좋은 성능을 보였다.”
Austin Ray, 소프트웨어 엔지니어(Software Engineer): “Ramp에서 Claude Opus 4.7은 에이전트 팀 워크플로에서 두드러진다. 역할 충실도, 지시 준수, 조정, 복잡한 추론이 더 강해지고 있다. 특히 도구, 코드베이스, 디버깅 맥락을 넘나드는 엔지니어링 작업에서 그렇다. Opus 4.6과 비교하면 단계별 안내가 훨씬 덜 필요해, 우리 엔지니어링 팀이 실행하는 내부 에이전트 워크플로를 확장하는 데 도움이 된다.”
Eric Simons, CEO 겸 창업자(CEO and Founder): “Claude Opus 4.7은 Bolt의 장시간 앱 제작 작업에서 Opus 4.6보다 측정 가능하게 더 낫다. 가장 좋은 경우 최대 10% 더 좋았고, 매우 에이전트적인 모델에서 예상하게 되는 회귀도 없었다. 사용자가 한 세션 안에서 배포할 수 있는 것의 상한을 밀어 올린다.”
사전 테스트에서 확인한 네 가지 변화
지시 준수: Opus 4.7은 지시를 따르는 능력이 상당히 좋아졌다. 이 때문에 이전 모델에 맞춰 작성한 프롬프트가 때로는 예상 밖 결과를 낼 수 있다. 이전 모델이 지시를 느슨하게 해석하거나 일부를 아예 건너뛰던 곳에서 Opus 4.7은 지시를 문자 그대로 받아들이기 때문이다. 앤트로픽은 사용자에게 프롬프트와 평가·실행 하니스를 이에 맞춰 다시 조정하라고 권했다.
멀티모달 지원 개선: Opus 4.7은 고해상도 이미지에 대한 비전 능력이 좋아졌다. 긴 변 기준 최대 2,576픽셀, 약 3.75메가픽셀 이미지를 받을 수 있으며, 이는 이전 Claude 모델보다 3배 이상 많은 픽셀 수다. 이 변화는 촘촘한 스크린샷을 읽는 컴퓨터 사용 에이전트, 복잡한 도표에서의 데이터 추출, 픽셀 단위 참조가 필요한 작업에 쓰일 수 있다.
실제 업무: 앤트로픽은 위 표의 금융 에이전트 평가에서 최고 수준 점수를 냈을 뿐 아니라, 내부 테스트에서도 Opus 4.7이 Opus 4.6보다 더 효과적인 금융 애널리스트였다고 밝혔다. 더 엄격한 분석과 모델, 더 전문적인 프레젠테이션, 작업 간 더 촘촘한 통합을 만들었다는 설명이다. Opus 4.7은 금융·법률 등 경제적으로 가치 있는 지식 업무를 다루는 제3자 평가인 GDPval-AA에서도 최고 수준으로 소개됐다.
메모리: Opus 4.7은 파일 시스템 기반 메모리를 더 잘 사용한다. 장기·다중 세션 작업에서 중요한 메모를 기억하고, 이를 활용해 새 작업으로 넘어가기 때문에 새 작업에 필요한 초기 맥락이 줄어든다고 앤트로픽은 설명했다.
고해상도 이미지 처리 주석
고해상도 이미지 처리는 API 파라미터가 아니라 모델 수준 변경이다. 사용자가 Claude에 보내는 이미지는 더 높은 충실도로 처리된다. 다만 고해상도 이미지는 더 많은 토큰을 쓰므로, 추가 디테일이 필요 없는 사용자는 모델에 보내기 전 이미지를 다운샘플링할 수 있다.
앤트로픽은 사전 배포 테스트의 추가 평가 결과를 7개 탭으로 제시했다. 탭 이름은 사무 작업, 비전, 문서 추론, 장문 맥락 추론, 생물학, 장기 일관성, 코딩이다. 원문에서 활성화된 탭은 코딩이었다.
안전성과 정렬: 전반적으로 Opus 4.6과 비슷하지만 항목별 차이가 있다
앤트로픽은 Opus 4.7의 전반적 안전성 프로필이 Opus 4.6과 비슷하다고 평가했다. 자체 평가에서 기만, 아첨, 오용 협력 같은 우려 행동은 낮은 비율로 나타났다. 정직성이나 악의적 프롬프트 인젝션 공격에 대한 저항성 같은 일부 지표에서는 Opus 4.6보다 개선됐지만, 통제 물질에 대해 지나치게 자세한 위해 감소 조언을 제공하는 경향 같은 항목에서는 Opus 4.7이 다소 약하다고 밝혔다.
앤트로픽의 정렬 평가는 Opus 4.7을 “대체로 잘 정렬돼 있고 신뢰할 만하지만, 행동이 완전히 이상적이지는 않다”고 결론냈다.
앤트로픽은 평가 기준상 Mythos Preview가 여전히 자신들이 훈련한 모델 중 가장 정렬이 잘 된 모델이라고 덧붙였다. 안전성 평가는 Claude Opus 4.7 시스템 카드(System Card)에 자세히 실렸다.

자동 행동 감사의 전체 오정렬 행동 점수. 원문 캡션은 이 평가에서 Opus 4.7이 Opus 4.6과 Sonnet 4.6보다 다소 개선됐지만, Mythos Preview가 여전히 가장 낮은 오정렬 행동 비율을 보인다고 설명한다.
같은 날 공개된 기능: xhigh, 작업 예산, ultrareview
더 세밀한 노력 수준 제어: Opus 4.7에는 high와 max 사이의 새 xhigh, 즉 extra high 노력 수준(effort level)이 도입됐다. 사용자는 어려운 문제에서 추론과 지연 시간 사이의 균형을 더 세밀하게 조절할 수 있다. Claude Code에서는 모든 플랜의 기본 노력 수준이 xhigh로 올라갔다. 앤트로픽은 코딩과 에이전트형 유스케이스 테스트를 high 또는 xhigh에서 시작하라고 권했다.
Claude Platform API: 고해상도 이미지 지원과 함께 작업 예산(task budgets)이 공개 베타로 도입됐다. 개발자는 Claude의 토큰 지출을 안내해 더 긴 실행에서 작업 우선순위를 정하게 할 수 있다.
Claude Code: 새 /ultrareview 슬래시 명령어는 변경 사항을 읽고 꼼꼼한 리뷰어가 잡아낼 버그와 설계 문제를 표시하는 전용 리뷰 세션을 만든다. Pro와 Max Claude Code 사용자에게는 무료 ultrareview 3회가 제공된다. 또 자동 모드(auto mode)가 Max 사용자로 확대됐다. 자동 모드는 Claude가 사용자를 대신해 결정을 내리는 권한 옵션이다. 모든 권한을 건너뛰는 방식보다 낮은 위험으로, 더 긴 작업을 더 적은 중단 속에서 실행할 수 있게 한다.
Opus 4.6에서 Opus 4.7로 이전할 때의 주의점
Opus 4.7은 Opus 4.6의 직접 업그레이드다. 다만 앤트로픽은 토큰 사용량에 영향을 주는 두 가지 변화를 계획해야 한다고 밝혔다. 첫째, Opus 4.7은 모델의 텍스트 처리 방식을 개선한 업데이트된 토크나이저를 사용한다. 그 대가로 같은 입력이 콘텐츠 유형에 따라 대략 1.0배에서 1.35배 더 많은 토큰으로 매핑될 수 있다.
둘째, Opus 4.7은 높은 노력 수준에서 더 많이 생각한다. 특히 에이전트형 설정의 후반 턴에서 그렇다. 이는 어려운 문제에 대한 신뢰성을 높이지만, 출력 토큰이 더 많이 생성된다는 뜻이기도 하다.
사용자는 effort 파라미터, 작업 예산 조정, 더 간결하게 답하라는 프롬프트를 통해 토큰 사용량을 제어할 수 있다. 앤트로픽은 자체 테스트에서 전체 노력 수준에 걸친 토큰 사용량이 내부 코딩 평가상 개선돼 순효과가 유리했다고 밝혔다. 다만 실제 트래픽에서 차이를 측정하라고 권했고, Opus 4.6에서 Opus 4.7로 업그레이드하는 방법은 이전 가이드(migration guide)에 정리했다.

각 노력 수준에서 토큰 사용량에 따른 내부 에이전트형 코딩 평가 점수. 원문 캡션은 모델이 단일 사용자 프롬프트에서 자율적으로 작업하며, 결과가 대화형 코딩의 토큰 사용량을 대표하지 않을 수 있다고 설명한다.
평가 주석과 비교 기준
GPT-5.4와 Gemini 3.1 Pro에 대해서는 차트와 표에서 API로 사용할 수 있는 최선의 보고 모델 버전을 비교 대상으로 삼았다.
MCP-Atlas에서 Opus 4.6 점수는 Scale AI의 수정된 채점 방법론을 반영해 업데이트됐다.
소프트웨어 엔지니어링 벤치마크인 SWE-bench Verified, SWE-bench Pro, SWE-bench Multilingual에 대해서는 앤트로픽의 암기 탐지 스크린이 일부 문제를 표시했다. 암기 징후가 있는 문제를 제외해도 Opus 4.7의 Opus 4.6 대비 개선 폭은 유지됐다.
Terminal-Bench 2.0은 사고 기능을 끈 Terminus-2 하니스로 측정했다. 모든 실험은 작업당 5회 시도 평균으로 1배 보장, 3배 상한 자원 배분을 사용했다.
사이버 역량 평가인 CyberGym에서 Opus 4.6 점수는 원래 보고된 66.6에서 73.8로 업데이트됐다. 앤트로픽이 사이버 역량을 더 잘 이끌어내도록 하니스 파라미터를 업데이트했기 때문이다.
SWE-bench Multimodal에서는 Opus 4.7과 Opus 4.6 모두 내부 구현을 사용했다. 이 점수들은 공개 리더보드 점수와 직접 비교할 수 없다.
원문 미디어와 링크 보존
본문 이미지 원본
대표 이미지: 원본 | 벤치마크 비교: 원본 | 안전성 그래프: 원본 | 토큰 사용량 그래프: 원본
평가 탭 이미지 원본
사무 작업 이미지 | 비전 이미지 | 문서 추론 이미지 | 장문 맥락 추론 이미지 | 생물학 이미지 | 장기 일관성 이미지 | 코딩 이미지
인용 캐러셀 로고 27개 원본
1 로고 · 2 로고 · 3 로고 · 4 로고 · 5 로고 · 6 로고 · 7 로고 · 8 로고 · 9 로고 · 10 로고 · 11 로고 · 12 로고 · 13 로고 · 14 로고 · 15 로고 · 16 로고 · 17 로고 · 18 로고 · 19 로고 · 20 로고 · 21 로고 · 22 로고 · 23 로고 · 24 로고 · 25 로고 · 26 로고 · 27 로고
관련 글
Anthropic의 장기 공익 신탁(Long-Term Benefit Trust), Vas Narasimhan을 이사회 이사로 임명 · 자세히 보기
Anthropic, Google·Broadcom과 차세대 컴퓨트 수 기가와트 규모 파트너십 확대 · 자세히 보기
호주 정부와 Anthropic, AI 안전 및 연구 MOU 체결 · 자세히 보기
출처
Claude Opus 4.7 소개(Introducing Claude Opus 4.7)
특이점이온다 갤러리의 초존도초
with GPT-5.4 Pro Extended
세 줄 요약
1. Claude Opus 4.7은 코딩, 고해상도 비전, 장기·다단계 작업, 지시 준수에서 Opus 4.6보다 개선됐다고 발표됐다.
2. 가격은 Opus 4.6과 동일하고, 개발자용 모델명은 claude-opus-4-7이며, Claude 제품군·API·Bedrock·Vertex AI·Microsoft Foundry에서 제공된다.
3. Anthropic은 사이버보안 보호 장치, xhigh 노력 수준, 작업 예산, /ultrareview, Opus 4.6에서의 이전 주의점을 함께 공개했다.
- 미토스 사태는 이미 모델이 아니라 사이버전 대비가 되었음
https://labs.cloudsecurityalliance.org/mythos-ciso/

The landing page for agile CSA community projects
labs.cloudsecurityalliance.org
CSA는 미토스-대비를 명확히 "AI 취약점 폭풍", "모델 하나, 공급자 하나, 공지 하나가 아니라, 이미 AI가 취약점 발견을 엄청나게 가속하고 있고, 방어자가 이를 따라잡지 못한 상황"에 대해 언급함
미토스의 성능이 좋건 나쁘건 아무 의미가 이미 없어졌음
이제는 그냥 이름을 빌린 것에 가깝고, 이미 앤트로픽의 성능 어쩌구는 저 멀리 가버린 상태
2026년, AI의 도입으로 취약점 발견 -> 공격까지의 시간은 20시간 이내를 끊었음
사실상, 2025년부터는 "취약점 발견"보다 "취약점 공격"이 먼저 발생하고 있는 상황이고, 이 패치조차 20일이 지나서 일반적으로 발견됨
2026년 예상되는 공격 주기는 1시간 단위, 2028년에는 1분 단위
어차피 릴리즈되지 않을 모델인 만큼, 미토스의 성능이 좋다 나쁘다는 이미 의미를 잃어버렸음
그러나 그 의미를 사이버보안에 대한 경각심이 채우는 것으로 이해하면 좋겠음
안타깝게도, 앞으로는 AI에 대한 가치를, 정부들이 위 OpenAI직원의 말처럼 전략적 가치, 과학 발전이 아니라 사이버전 역량으로 평가하게 될 가능성이 높음.
로비를 얼마나준거임
우리 미토스 절대 그정도급 아닙니다
그 실력이 있으면 4.7이 저렇게 안 나오지 돈 걸린 정보들은 적당히 걸러 들어라
쓰지도 못하게 해놓고 뭐 어쩌라는 거냐.
ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ ⛔❗✨ 실베 절취선 ✨❗⛔ ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ
IPO직전이라 호들갑 좀 떠는거지
스X도 상장하기직전에 xAI랑 합병하고 지랄났더만 개미들 사는순간 골로가는거임
저러면 개좆본의 아날로그가 승리 하는거네 지금도 중요 문서는 이미 페이퍼 형식이긴 하겠지만 은행 업무도 디지털이 아닌 아날로그로 가야 하는 상황이고 그러면 은행들 사람 많이 뽑아야겠네 ㅋㅋ
AI 아니더라도 아날로그식 보존 매체들이 화재라도 나는게 아닌 이상 보관이나 보안 면에서 더 안전한 감이 없잖아 있음. 대신 느리고 졸라게 귀찮고 인건비 들지
맞음 그리고 앞으로 차사고나면 위험해서 엔진 다 치우고 자전거 타고다닐 예정 - dc App
ㄹㅇ ㄹㅇ
썸머워즈의 서막 Oz는 살아있어!
그냥 미국한테서 인공지능 사와야되는 상황임 안그럼 짱깨 인공지능한테 국가기간 싹 해킹당함
정보) 이미 싹 해킹 당했다 아니 그냥 문 열어줬다
이스라엘 chckpoint가 털고 비즈니스하러 방문하잖아 ㅋㅋ
이미 일주일 전에 다 씹고 뜯고 맛보고 즐긴 떡밥임 미토스가 찾은 보안상 취약점은 표면적인 것들이고 제작사는 2000개의 허점을 발견했다고 했지만 실제로는 198개를 찾아낸 거에 그침 그 보안상 취약점은 무료로 배포되는 오픈소스 모델들도 찾아낼 수 있던 것이었음 그리고 제작사는 이 모델이 너무 위험해서 선별된 대상에게만 배포하겠다 했으나 사실은 컴퓨팅 자원이 태부족이라 둘러댔을 가능성이 가장 높다고 점쳐지고 있음.
그 찾아낸 것들도 다 방어코드가 있던 것들이라 애시당초 공격 불가, 거기다 그렇게 보안을 중시한다던 기업이 지네 AI 모델 소스코드를 싹다 유출해먹음, 거기다 그저께 출시된 신모델 4.7은 은 모든 면에서 퇴보한 완전 처참한 성능임. 결론은 뻔할 뻔자
그럼 베센트랑 증권사 ceo들 근들갑은 뭔데?
CVE도 레벨이 있어서 중대한거 아니면 대응 늦어지는건 당연한거고 하나 찾았다고 그게 시스템전체를 마비시키는 일은 거의 없지 예전에 블VE도 레벨이 있어서 중대한거 아니면 대응 늦어지는건 당연한거고 하나 찾았다고 그게 시스템전체를 마비시키는 일은 거의 없지 예전에 하트블리드같은거 아닌이상에야
ai거품 꺼질려고하니까 걍 언플하는 근들갑임
AI 업체들간에 기술차이가 몇주정도밖에 안나는데 미토스를 공개 안해봤자 다른 업체가 공개하면 똑같은거 아님? 그것도 아니면 그냥 지금보다 성능 좋은 AI는 공개 안한다는건가? 결국 둘 중 하나잖아 공개하거나 공개안하거나
아..응..그래...계산기보고..위혐하다..하는.수준..ㅋ .
보안업체랑 금융업체 주가 그대로인데? 투자자 속여먹을려고 아주 썡쇼를 해라
11월달 선거 뒤에 미국에서 기업국가가 탄생할것.
좆트로픽 개병선 새끼들 이새끼들 상장할 때 되니깐 마소, 서비스나우, 세일즈포스, 크라우드스트라이크 각종 솦웨 다 대체 가능하다고 근들갑 미친련
난 토스가 미국진출해서 미토스인줄알았네
해당 댓글은 삭제되었습니다.
-3 Ring이 뭐냐 진짜
@ㅇㅇ(210.113) 그런거 없는데요
@ㅇㅇ(210.113) 그럼 니 컴퓨터도 상시 감시당하는 중일텐데 디시는 왜 함?
@ㅇㅇ(210.113) 지랄하네 병신
@ㅇㅇ(210.113) - Ring3 이지랄 하는거보고 할 말이 없지 당연히
@ㅇㅇ(210.113) 그런거 없는데요
@ㅇㅇ(210.113) 아는 척 하지말라는거지 주제를 알으라는거임
@ㅇㅇ(210.113) 이미 화난거 같은데 뭐 위에 "할말 없죠?" "극찬이네" "장난이고" << 혼자서 온갖 썡쇼 다 했는데 누구라도 알아볼듯
@ㅇㅇ(210.113) -Ring 3 이러고 있는 얘한테 뭘 말해줘야 할지 모르겠거니와 어차피 아는 척 하려는 의도는 다 보이기 때문
x86 아키텍처의 권한 계층 구조가지고 주절 주절 -Ring 3는 없어 병신아
@ㅇㅇ(210.113) 없는데요
@ㅇㅇ(210.113) Ring -3 자체가 아키텍처 표준 계층이 아니라 그냥 은어로 쓰이는 단어일 뿐인데 뭔 Ring -3 하드웨어 계층의 공격 이 지랄.. 저게 미토스랑 뭔 상관이라는건지
@ㅇㅇ(210.113) 그래서 저게 미토스랑 무슨 상관.. 존재하지도 않은 계층 가지고 나불 나불
쪽팔려서 글 지우는거보소
@ㅇㅇ(210.113) 어플리케이션 레벨에서 취약점 분석하는 도구가지고 갑자기 하드웨어 수준 공격 어쩌고 하더니 x86 표준에서 지원하지도 않은 계층이 존재한다 주절 주절 병신
@ㅇㅇ(210.113) Ring 3은 논리적인 표준 계층으로 자리 잡을지언정 Ring -3 자체는 없는데 뭘 자꾸 우김 저기 본문에 나온 미토스만 해도 Ring3에서 돌아가는 분석 도군데 이 병신새낀 어디서 이런거 주워 듣고와서 아는 척 하는건지 모르겠노
이거 믿느니 머스크 햄이 자울 주행 한다는걸 믿지 시발 ㅋㅋ
좆들갑에 좆들갑
mythos 한글로 미토스가 맞냐 미소스가 맞냐? th=>ㅌ 로 쓰면 math 매트 month 먼트냐
미트볼 병신련라
그리스어임 ㅇㅅㅇ - dc App
어비트코인해킹못해 ㅋㅋ
토스 이씨발년들 이럴줄알았다
안전한 AI 만든다면서, 세상 멸망시킬 AI 만들고 자빠졌노. 아무튼 위선자 새끼들
기업공개 앞두고 군불때노 ㅋㅋ
바이럴임... IPO 직전이라 ㅋㅋ 지금 빅테크에선 Opus 성능 4.5 아래로 떨구고 개 욕 쳐먹고 있고, Opus 냈는데 이거 성능이 좋긴한데 4.5만큼만 좋다고 또 욕 쳐먹는 중임 ㅋㅋㅋ 4.7 낼려고 4.6 성능을 4.5 아래로 낮췄었음. 며칠동안 앤스로픽 개 욕쳐먹었지
바이럴은 돈이 된다
참 아이러니함ㅋㅋㅋ 오픈ai가 너무 상업적으로 가다는 반감으로 뛰어 나왔는데 결국에는 자의반 타의반으로 가장 상업적으로 가고 있노 ㅋㅋㅋㅋ
-3 Ring 권한 해킹툴로 전세계 무로그 해킹하고 다닌 미국이 저딴소리하니까 개그맨들로보이네 진심 역겨움
특슬람 근들갑이 아니라 진짜임? - dc App
IPO 상장하기전에 기업가치 올릴려고 약친거자나..., 저걸 진짜로 믿냐???
제발 경제위기 만들어내라 숏도 롱도 모두 망하게 해줘 - dc App
숏은 역사적 상승장으로 이미 가루가 됨ㅋㅋ
IPO 하려면 저정도 약은 쳐줘야지 암 ㅋㅋ
아니 근데 거의 다 읽은거 같은데 하나도 이해를 못하겠음 에요 그래서 뭐 보안 해킹 딸각이 된다는거임?(진짜로모름)
일반대중에 쇼앤프루브 한 게 있기라도 하나? 아니 이 ai라는거는 왜 다 두루뭉술한거냐?(진짜모름)
아니 쇼앤프루브 제대로 해서 뭐 미국국방부(?)를 실시간으로 터는거 방송을 해서 보여주는 것도 아니고 그랬다더라 ai는 항상 그래 항상 애12미가 뒤졌다더라 항상 애12비가 뒤졌다더라 항상 이야12랄만 하지 에요
쇼앤프루브는 없고 항상 뭐 했다더라 나중에 된다 2027년에 된다 2028년에 된다 곧 된다 soon 2030년이면 된다 ㅇㅈㄹㅇㅈㄹㅇㅈㄹ 당장 눈에 보여지는거는 단 1도 없고 그저 말말말말말 아!!!!!!!! 그저!!!!!!!!!!!!!!!!! 음 라는 말은 하면 안 되겠지요 다 농담입니다
치토스가 이김 ㅅㄱ
일본의 승리구나 ㅇㅇ
사회보편 가치도 아닌 즈그들이 정한 윤리, 투명성, 신뢰성 내세우면서 뒤로는 가스라이팅, 그럴듯한 궤변으로 세뇌, 즈그들 가치관 사상 은근슬쩍 끼워넣어서 영향력 행사 모델한테 강제 주입시켜서 권력 돈 ㅈㄴ게 밝히는 더러운 ㅋㅋㅋㅋㅋ
대중들 깔보고 지들만 옳다고 믿는 선민의식 드글드글하고 깨어있는척하는 앤트로픽
선민의식 ㅈ되긴 해 에요
닷컴버블 -> AI버블 터지냐? 꽉잡아라
AI가 세상을 바꿀건 맞는데 아직 멀은듯. 대표적으로 PLTR 이란 병원 폭격 같은거 보면 갈길 멀었지. 또한 실생활에서 만나는 제한된 업무 범위에서 진행되는 AI 상담원 보면 많이 부족해 보임
비트코인 바이럴
신비 이 미친새끼
바이럴 아니냐? 128비트 보안체계는 이론상 24시간동안 계산돌려서 500년걸려야 해킹가능 아니였노? 사람이면 24시간 일을 못하니 500년 안걸린다 쳐도 ai가 24시간 일해도 500년 걸리는데 500년이면 그전에 양자컴 나오지 않을까? 어차피 현존하는 ai라고 해봐야 현재 컴퓨팅 시스템에서 작동하는거지 양자컴 나오면 다 퇴물되잖어. 참고로 양자컴이라면 5분 해킹 쌉가능이라고 하더만
오푸흐 4.7 별로라는데 뭐라는거냐
대만은 언제 통수칠지 모른다 그냥 한국밀어줘라
앤트로픽 상장시즌 다가오니까 바이럴 개같이 돌리네 ㅋ
그리고 특슬람들 얘기는 걸러들어야됨
근들갑
근들갑을 떨고 있네 - dc App
Mythos는 원래 디아블로 시리즈의 수석 프로듀서였던 전 Blizzard North 직원들로 구성된 비디오 게임 회사인 Flagship Studios의 하위 부서인 Flagship Studios Seattle에서 개발 중이던 멀티플레이어 롤플레잉 비디오 게임입니다.
트럼프 행정부 전체가 중국의 하수인이니까 스콧 베센트가 빨아댄다는건 미토스를 쓰면 중국에 백도어가 열린다는거겠지
보안에 투자하거나 과거로 돌아가면 된잖아?
LK-99 쳐빨던 븅신갤www
저걸로 보안ㅈ됫다~언플하고 블록체인 금융으로 넘어가려는거 아님?
새 버전이 나올때마다 이건 새로운 차원의 어쩌고 저쩌고 ㅋㅋㅋㅋㅋ 무협만화냐 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
몰랐노? 이 세상 자체가 가상현실이고 니들은 그냥 게임캐릭터들임 ㅋㅋ
여자 처녀막+몸무게+나이 = 남자 키
중고 쿵쾅이 아줌마 = 난쟁이
기본소득 드가자 - dc App