AGI(Artificial General Intelligence)는 사람들에게 다양한 의미를 지니지만, 가장 중요한 부분은 ChatGPT, Bard, LLaMA 및 Claude와 같은 현 세대 의 고급 AI 대규모 언어 모델을 통해 이미 달성되었습니다. 이러한 "프론티어 모델"에는 많은 결함이 있습니다. 학문적 인용 및 법원 사건을 환각하고, 훈련 데이터에서 편견을 영속시키고, 간단한 산술 실수를 범합니다. 인간이 흔히 나타내는 결함을 포함하여 모든 결함을 수정하려면 완전히 다른 프로젝트인 인공 초지능을 구축해야 합니다.

그럼에도 불구하고 오늘날의 프론티어 모델은 훈련받지 않은 새로운 작업에서도 유능하게 수행되어 이전 세대의 AI 및 감독 딥 러닝 시스템이 결코 관리하지 못했던 한계점을 넘어섰습니다. 1945년 ENIAC이 이제 최초의 진정한 범용 전자 컴퓨터로 인식되는 것처럼 지금부터 수십 년 후에는 AGI의 최초의 진정한 사례로 인식될 것입니다 .


일반 지능이란 무엇입니까?

초기 AI 시스템은 단일 작업에 집중하고 때로는 인간 수준에 가깝거나 그 이상으로 수행하는 좁은 인공 지능을 보여주었습니다. 1970년대 스탠포드 대학의 Ted Shortliffe가 개발한 프로그램인 MYCIN은 박테리아 감염에 대한 진단 및 권장 치료법만을 제공했습니다. SYSTRAN은 기계 번역만 했습니다. IBM의 Deep Blue는 체스만 두었습니다.

AlexNet 및 AlphaGo 와 같은 지도 학습으로 훈련된 최신 심층 신경망 모델은 이전의 휴리스틱, 규칙 기반 또는 지식 기반 시스템에서 오랫동안 피했던 기계 인식 및 판단 분야의 여러 작업을 성공적으로 수행했습니다.

가장 최근에 우리는 각 작업에 대해 명시적으로 교육을 받지 않고도 다양한 작업을 수행할 수 있는 프론티어 모델을 보았습니다. 이러한 모델은 다섯 가지 중요한 방식으로 인공 일반 지능을 달성했습니다.

주제 : 프론티어 모델은 온라인에 관해 작성된 모든 주제를 다루는 다양한 인터넷 소스의 수백 기가바이트에 달하는 텍스트로 훈련됩니다. 일부는 또한 크고 다양한 오디오, 비디오 및 기타 미디어 컬렉션에 대한 교육을 받았습니다.

작업 : 이러한 모델은 질문에 대답하기, 스토리 생성하기, 요약하기, 음성 복사하기, 언어 번역하기, 설명하기, 의사 결정하기, 고객 지원하기, 조치를 취하기 위해 다른 서비스 호출하기, 단어와 이미지 결합하기 등 다양한 작업을 수행할 수 있습니다.

양식 : 가장 인기 있는 모델은 이미지와 텍스트를 대상으로 작동하지만 일부 시스템은 오디오 및 비디오도 처리하고 일부는 로봇 센서 및 액추에이터에 연결됩니다. 양식별 토크나이저를 사용 하거나 원시 데이터 스트림을 처리함으로써 프론티어 모델은 원칙적으로 알려진 모든 감각 또는 운동 양식을 처리할 수 있습니다.

언어 : 영어는 대부분 시스템의 학습 데이터에서 과도하게 표현되지만 대규모 모델은 학습 데이터에 예제 번역이 없는 언어 쌍의 경우에도 수십 개의 언어로 대화하고 해당 언어 간에 번역할 수 있습니다. 훈련 데이터에 코드가 포함되면 자연어와 컴퓨터 언어 간의 점점 더 효과적인 "번역"도 지원됩니다(예: 일반 프로그래밍 및 리버스 엔지니어링).

교육 가능성 : 이러한 모델은 훈련 데이터가 아닌 프롬프트를 통해 학습하는 ' 상황 내 학습 '이 가능합니다 . " Few-shot 학습 "에서는 몇 가지 입력/출력 쌍의 예를 사용하여 새로운 작업을 시연하고 시스템은 새로운 입력에 대한 출력을 제공합니다. "제로 샷 학습"에서는 새로운 과제가 설명되지만 예는 제공되지 않습니다 (예: "헤밍웨이 스타일로 고양이에 관한 시 쓰기" 또는 "'동등어'는 서로 반대되는 단어 쌍이며 같은 수의 문자를 가지고 있습니다. '동의어'는 무엇입니까?”).
"

AGI의 가장 중요한 부분은 현재 세대의 고급 AI 대형 언어 모델을 통해 이미 달성되었습니다."



- dc official App