3dbcd723a8826ae87eb1d19528d52703a6b7eefea59ab00d

3dbcd723a8826ce87eb1d19528d52703ad43091152d730b7



3dbcd723a8826be87eb1d19528d52703f22387420f2b6521




3dbcd723a8826ee87eb1d19528d52703cd58c7ca189cbb5e


3dbcd723a8826de87eb1d19528d5270349a90681a39f50c8



3dbcd723a8826fe87eb1d19528d527032dcc1a7b5b402a47



3dbcd723a88260e87eb1d19528d52703c91750a111118620


3dbcd723a88261e87eb1d19528d527033286bbfe4ee11062


3dbcd723a88368e87eb1d19528d527031c04cc755616a2c7


3dbcd723a88369e87eb1d19528d527038056e5abde45f07d


3dbcd723a8836ae87eb1d19528d52703a9cd8d7d2e8acc4f


3dbcd723a8836be87eb1d19528d5270314230c4981893d83


3dbcd723a8836ce87eb1d19528d5270372180a0944497cd7


3dbcd723a8836de87eb1d19528d52703b8133be7dca9fc4b


3dbcd723a8836ee87eb1d19528d527037a89b41186798bd6


알렉세이 이바흐넨코 Alexey G. Ivakhnenko, 1913~20071. 일생: 전기공학자에서 인공지능 선구자로

알렉세이 그리고리예비치 이바흐넨코는 1913년 3월 30일, 지금의 우크라이나 폴타바 지역인 코벨랴키 근처에서 태어났습니다. 우크라이나식 이름으로는 올렉시 흐리호로비치 이바흐넨코라고도 표기됩니다. 그는 1938년 레닌그라드 전기공학연구소를 졸업했고, 이후 모스크바의 전기공학 연구기관에서 자동제어 문제를 연구했습니다. 1944년에는 키이우로 돌아와 우크라이나 학술기관과 키이우 공과대학에서 활동했습니다. (GMDH)

처음부터 “AI 연구자”였던 것은 아닙니다. 그는 원래 자동제어, 전동기 제어, 기술 사이버네틱스 분야의 전문가였습니다. 키이우 공과대학 자료에 따르면 그는 전기모터 속도 제어 장치, 자기증폭기 시스템, 자동제어의 불변성 이론, 복합 제어 시스템 등을 연구했으며, 기술 사이버네틱스 분야의 초기 국내 모노그래프를 쓴 인물로 소개됩니다. (kpi.ua)

이 점이 흥미롭습니다. 이바흐넨코는 챗봇이나 이미지 인식에서 출발한 사람이 아니라, 복잡한 공학 시스템을 어떻게 예측하고 제어할 것인가라는 문제에서 출발했습니다. 그런데 이 질문이 결국 “데이터를 보고 스스로 모델을 만드는 기계”라는 AI적 발상으로 이어졌습니다.

2. 핵심 업적: GMDH

이바흐넨코의 대표 업적은 GMDH입니다. GMDH는 1968년 무렵 키이우의 사이버네틱스 연구소에서 발전한 방법으로 소개됩니다. GMDH 역사 자료는 이 방법이 1968년부터 우크라이나 키이우의 Institute of Cybernetics 안에 있던 Combined Control Systems 그룹에서 개발되었다고 설명합니다. (GMDH)

GMDH의 핵심은 단순합니다.

사람이 모델 구조를 미리 정하지 않고, 컴퓨터가 데이터로부터 좋은 모델 구조를 스스로 찾아가게 하자.

예를 들어 어떤 복잡한 현상의 결과를 예측해야 한다고 해봅시다. 날씨, 경제, 공장 시스템, 기계의 움직임처럼 변수가 많고 관계가 복잡한 문제입니다. 기존 방식은 사람이 “이 현상은 이런 방정식으로 설명될 것이다”라고 가정한 뒤 모델을 만들었습니다. 하지만 이바흐넨코는 반대로 생각했습니다.

“현상의 내부 구조를 완벽히 몰라도, 입력과 출력 데이터를 보고 적절한 모델을 기계가 찾아낼 수 있지 않을까?”

이것이 GMDH의 중요한 발상입니다.

3. GMDH는 어떻게 작동하는가?

GMDH는 여러 후보 모델을 만들고, 그중 좋은 것만 살아남기는 방식으로 작동합니다. 쉽게 비유하면 수식들의 오디션 프로그램입니다.

처음에는 입력 변수들을 둘씩 묶어서 작은 후보 수식을 만듭니다. 예를 들어 x1, x2, x3, x4 같은 입력이 있다면, x1과 x2, x1과 x3, x2와 x4 같은 조합을 만들어 각각 예측 수식을 만듭니다. 그리고 실제 데이터에 얼마나 잘 맞는지 평가합니다.

그다음 성능이 좋은 후보만 다음 단계로 올라갑니다. 다음 층에서는 살아남은 후보들이 다시 조합되어 더 복잡한 후보 모델을 만듭니다. 이 과정을 반복하면, 모델이 점점 여러 층을 가진 구조가 됩니다.

이바흐넨코의 1971년 논문 「Polynomial Theory of Complex Systems」는 GMDH가 여러 층의 “부분 설명”을 쌓아 “완전한 설명”을 구성하는 방식이라고 설명합니다. 또한 모든 실험 데이터를 훈련용과 검사용으로 나누고, 훈련 데이터로 계수를 계산한 뒤 별도 검사용 데이터로 후보 모델의 품질을 평가한다고 설명합니다.

이 부분이 매우 현대적입니다. 오늘날 머신러닝에서도 훈련 데이터와 검증 데이터를 나누고, 검증 성능이 좋은 모델을 선택합니다. 이바흐넨코는 이미 1970년대 초에 훈련 데이터에만 잘 맞는 모델은 위험하다는 문제를 알고 있었고, 별도의 데이터로 성능을 확인하는 방식을 강조했습니다. 그의 논문은 훈련에 사용한 데이터를 다시 평가에 쓰면 잘못된 해가 나올 수 있다고 설명하며, 그래서 훈련 집합과 검사용 집합을 나누어야 한다고 말합니다.

4. 왜 “딥러닝의 숨은 조상”인가?

이바흐넨코의 GMDH가 현대 딥러닝과 완전히 같은 것은 아닙니다. 현대 딥러닝은 보통 역전파, 대규모 데이터, GPU, 행렬연산, 신경망 가중치 최적화를 사용합니다. 반면 GMDH는 주로 다항식 회귀, 층별 선택, 자기조직화에 가까운 방식입니다.

하지만 닮은 점이 분명합니다.

첫째, 여러 층을 쌓는다는 점입니다. GMDH는 한 번의 단순 회귀로 끝나지 않고, 좋은 중간 결과를 다음 층의 입력으로 넘기면서 더 복잡한 표현을 만듭니다. Schmidhuber의 딥러닝 역사 논문은 GMDH 네트워크가 층을 점진적으로 만들고, 회귀분석으로 학습하며, 별도 검증 집합을 이용해 불필요한 유닛을 제거하고, 층 수와 각 층의 유닛 수를 문제에 따라 학습할 수 있었다고 설명합니다.

둘째, 내부 표현을 스스로 만든다는 점입니다. 현대 딥러닝도 처음 층에서는 단순한 특징을, 깊은 층에서는 더 복잡한 특징을 학습합니다. GMDH 역시 후보 변수와 중간 변수를 조합해 점점 복잡한 예측 구조를 만들어갑니다.

셋째, 모델 구조를 자동으로 고른다는 점입니다. 요즘 말로 하면 GMDH는 아주 초기 형태의 AutoML 또는 신경망 구조 탐색처럼 볼 수 있습니다. 사람이 “몇 층짜리 모델을 써라”라고 완전히 정해주는 것이 아니라, 데이터 성능을 보면서 어느 구조가 좋은지 선택해 나갑니다. 이바흐넨코의 논문은 GMDH가 “perceptron-like multilayer structure”를 갖고, 특정 층에서 예측 정확도가 기준 이상인 변수만 다음 층으로 넘어간다고 설명합니다.

그래서 이바흐넨코는 “현대 딥러닝을 만든 사람”이라고 단순화하기보다는, 딥러닝적 사고방식의 초기 형태를 만든 사람이라고 하는 것이 정확합니다.

5. 1971년 논문이 중요한 이유

1971년 이바흐넨코의 논문 「Polynomial Theory of Complex Systems」는 그의 아이디어를 영어권 학계에 알리는 데 중요한 역할을 했습니다. 이 논문은 IEEE Transactions on Systems, Man, and Cybernetics에 실렸고, 복잡한 시스템을 다항식 설명으로 모델링하는 방법을 다룹니다.

논문에서 그는 복잡한 시스템을 설명할 때 중요한 문제는 **“적절한 복잡도의 모델을 찾는 것”**이라고 보았습니다. 모델이 너무 단순하면 현상을 제대로 설명하지 못하고, 너무 복잡하면 훈련 데이터에만 과하게 맞아 실제 예측력이 떨어질 수 있습니다. 이 논문은 예측 모델의 핵심 문제를 “최적 복잡도”의 다항식 설명을 찾는 것으로 제시합니다.

이건 현대 머신러닝에서도 핵심 문제입니다.

모델이 너무 단순하면 과소적합, 너무 복잡하면 과적합. 그렇다면 적절한 복잡도는 어떻게 찾을 것인가?

이바흐넨코는 이 질문에 대해 “데이터로 후보 모델을 만들고, 별도의 검사용 데이터로 성능을 평가하면서 좋은 구조를 고르자”고 답한 셈입니다.

6. 왜 AI 시대에 중요한가?

이바흐넨코의 영향력은 크게 세 가지로 정리할 수 있습니다.

첫째, 그는 데이터 기반 모델링의 중요성을 일찍 보여주었습니다. 복잡한 시스템의 내부 원리를 완벽히 모르더라도, 입력과 출력 데이터를 이용해 예측 모델을 만들 수 있다는 생각은 오늘날 머신러닝의 핵심입니다. 키이우 공과대학 자료도 이바흐넨코가 복잡한 과정의 귀납적 분석, 모델링, 예측 방법을 개발하고 도입한 과학 방향의 창시자라고 설명합니다. (kpi.ua)

둘째, 그는 모델이 스스로 구조를 조직한다는 발상을 발전시켰습니다. GMDH는 단순히 계수만 맞추는 것이 아니라, 어떤 변수 조합을 다음 층으로 보낼지, 어느 정도 복잡한 모델을 선택할지를 데이터에 따라 결정합니다. 이는 오늘날의 자동 모델 선택, 특징 선택, 구조 탐색과 연결해서 설명하기 좋습니다.

셋째, 그는 딥러닝의 역사적 시야를 넓혀주는 인물입니다. 딥러닝을 2010년대 GPU 혁명만으로 설명하면, 그 이전 수십 년의 실험과 실패, 다른 방식의 다층 학습 연구가 사라집니다. 이바흐넨코는 “딥러닝은 어느 날 갑자기 나온 유행이 아니라, 복잡한 시스템을 데이터로 학습시키려는 오랜 시도의 결과”라는 점을 보여줍니다.

7. 한계와 정확한 평가

다만 이바흐넨코를 설명할 때 주의할 점도 있습니다.

그를 단순히 **“딥러닝의 아버지”**라고만 말하면 조금 과장될 수 있습니다. 현대 딥러닝의 주류는 역전파, CNN, RNN, Transformer, 대규모 사전학습 같은 흐름을 통해 발전했습니다. 이바흐넨코의 GMDH는 그 흐름과는 다른 방식의 다항식 기반 자기조직화 모델입니다.

그래서 가장 정확한 표현은 이것입니다.

이바흐넨코는 현대 딥러닝의 직접적 완성자가 아니라, 다층 학습·자기조직화 모델·자동 구조 선택이라는 아이디어를 매우 일찍 보여준 선구자이다.