단일 연산자 EML로 모든 초등 함수 표현하기
목차
개요
야기엘로니아 대학의 Andrzej Odrzywołek은 단 하나의 이항 연산자와 상수 1만으로 표준 초등 함수 전체를 표현할 수 있음을 구성적으로 입증했다.
논문 abstract의 핵심은 다음과 같다. 디지털 하드웨어에서는 단일 게이트(NAND)만으로 모든 불 논리를 구현할 수 있지만, 연속 수학에서는 그에 비견되는 단일 원시 연산자가 알려져 있지 않았다. 저자는 eml(x, y) = exp(x) − ln(y)와 상수 1의 결합이 과학용 계산기의 모든 표준 함수를 생성한다는 사실을 보이고, EML 컴파일러와 경사 기반 기호 회귀 응용까지 함께 제시한다.
배경과 선행 연구
단일 연산자의 역사
저자는 NAND 게이트, 연산 증폭기, ReLU 활성화 함수 등 단일 원시 연산자 또는 단일 원소가 큰 시스템을 생성하는 사례를 역사적 맥락으로 제시한다. “단일 충분 연산자의 존재가 개념적으로 결정적인지는 논쟁의 여지가 있지만, 이해·교육·대중 소통 측면에서는 실질적 가치가 있다”는 입장을 명확히 한다.
이 흐름의 출발은 로그 함수가 곱셈을 덧셈으로 환원한 역사다.
1
x × y = e^(ln x + ln y)
지수와 로그의 짝이 곱과 합 사이의 다리를 놓은 것처럼, 두 함수의 차분 형태인 eml이 더 광범위한 환원을 가능케 한다는 것이 저자의 동기다.
Related Work 정리
| 카테고리 | 선행 연구 / 시스템 | 본 연구와의 차이 |
|---|---|---|
| 불 논리 단일 게이트 | NAND, NOR (Sheffer stroke) | 이산 → 연속 영역으로 확장 |
| 단일 명령 컴퓨터 | SUBLEQ, FRACTRAN | 알고리즘 표현 → 함수 표현으로 일반화 |
| 셀룰러 오토마타 | 단일 규칙 우주적 표현 | 격자 시스템 → 연속 함수 |
| 퍼지 논리 변형 | t-norm 단일 연산자 | 논리 연산 → 초등 함수 전 영역 |
본 연구는 Sheffer 형 연산자가 수학적 논리 외 영역에서는 드물게 발견된다는 점을 강조하며, 연속 수학에서의 첫 번째 명시적 사례를 제시한다.
방법론
EML 연산자 정의와 문법
EML 연산자는 두 인자의 지수와 로그의 차이로 정의된다.
1
eml(x, y) = exp(x) − ln(y)
EML 표현 트리의 문법은 극단적으로 단순하다.
1
S → 1 | eml(S, S)
상수 1과 eml만으로 임의의 트리를 만들 수 있으며, 이 트리는 표준 초등 함수의 표현이 된다. 예를 들어 e^x = eml(x, 1)은 깊이 1로 표현되고, ln(z) = eml(1, eml(eml(1, z), 1))은 깊이 3으로 표현된다.
축소 단계와 부트스트래핑 검증
저자는 과학용 계산기의 36개 원시 함수를 단계적으로 축소하는 체계적 제거 실험을 수행한다.
| 단계 | 구성 요소 | 원시 개수 |
|---|---|---|
| Calc 3 | exp, ln, 부정, 역수, 덧셈 | 6 |
| Calc 2 | exp, ln, 뺄셈 | 4 |
| Calc 1 | 거듭제곱, 로그, 상수 | 4 |
| Calc 0 | exp, 로그 | 3 |
| EML | eml과 상수 1 | 2 |
각 단계에서 환원이 정확한지 검증하기 위해 저자는 대수적으로 독립인 초월 상수를 변수에 대입해 수치 계산하고, 그 결과를 역기호 계산기로 후보 공식과 매칭한다. 주로 사용된 상수는 Euler-Mascheroni 상수 γ ≈ 0.577216이다.
실험 셋업
저자는 EML 트리의 학습 가능성을 평가하기 위해 경사 기반 기호 회귀 실험을 설계한다.
각 입력에 대해 마스터 형식은 선형 결합으로 구성된다.
1
α_i + β_i × x + γ_i × f
여기서 f는 직전 eml 연산의 출력이다. 레벨 n 트리는 5 × 2^n − 6개의 파라미터를 요구한다. 최적화 파이프라인은 다음 세 단계로 구성된다.
| 단계 | 절차 |
|---|---|
| 1 | Adam 확률적 경사 하강법 |
| 2 | Hardening (가중치를 0/1 집합으로 강제) |
| 3 | 정확한 기호 클램핑 |
학습 데이터는 ln(e − ln(e^x − ln y)) 같은 합성 EML 함수로 생성된다. 직접적 기호 검증은 계산적으로 다루기 어려워, 일반적으로 Kolmogorov 형 복잡도 K가 약 7 이하인 경우만 다루며 실제 탐색은 K=9까지 수행되었다.
주요 결과
복잡도 비교
대표 함수의 RPN 코드 길이 K는 다음과 같다.
| 함수 | RPN 길이 K |
|---|---|
| e | 3 |
| 0 | 7 |
| ln x | 7 |
| −x | 57 |
| x² | 75 |
지수와 로그처럼 EML 정의에 직접 등장하는 연산은 짧은 코드로 표현되지만, 단순 부호 반전 −x조차 57의 코드 길이를 요구할 정도로 부분 함수에 따라 비대칭이 크다. 저자는 eml 자체가 비가환·비대칭이기 때문에 직관적으로 단순한 연산이 EML 체계에서 비자명하게 표현되는 것이 자연스럽다고 설명한다.
기호 회귀 성능
랜덤 초기화에서 정확 복구 성공률은 트리 깊이에 따라 급격히 감소한다.
| 트리 깊이 | 정확 복구율 |
|---|---|
| 2 | 100% |
| 3–4 | 약 25% |
| 5 | 1% 미만 |
| 6 | 0 / 448 시도 |
깊이 6에서 무작위 초기값으로는 단 한 번도 복구하지 못했지만, 정답 근처에서 가우시안 노이즈를 더한 perturbed 초기화를 사용하면 깊이 5–6에서도 100% 수렴이 가능했다. 정확 복구가 일어난 경우 평균 제곱 오차는 약 10^−32로 기계 정밀도의 제곱 수준에 도달한다.
관련 연산자 변형
저자는 EML 외에 가까운 변형 연산자도 식별했다.
| 연산자 | 정의 | 짝이 되는 상수 |
|---|---|---|
| EML | exp(x) − ln(y) | 1 |
| EDL | exp(x) / ln(y) | e |
| 인자 교환 EML | ln(x) − exp(y) | −∞ |
세 연산자 모두 동일한 표현력을 가지지만 짝이 되는 상수가 다르다. EML이 가장 자연스러운 형태인 이유는 짝이 되는 상수가 1로 가장 단순하기 때문이다.
한계와 디스커션
저자가 명시한 한계는 다섯 가지다. 첫째, 삼각 함수 표현을 위해 내부 계산이 복소수 영역에서 이루어져야 하며, ln(−1) 같은 분기 절단을 다뤄야 한다. “양자 컴퓨팅이 실수 확률을 계산하기 위해 복소 진폭을 쓰는 것처럼, EML은 실수 초등 함수를 계산하기 위해 복소 중간값을 사용한다”는 비유를 제시한다. 둘째, 정의역 제약이 있어 0과 정의역 경계에서 일부 점은 제외해야 한다. 셋째, 음의 실수축에서는 i가 들어간 식의 부호 보정을 위한 principal branch 처리가 필요하다. 넷째, NAND 게이트가 입력만으로 0과 1을 만들 수 있는 것과 달리 EML은 상수 1과 짝을 이루어야 한다. 다섯째, 직접 기호 검증이 계산적으로 다루기 어려우며 K가 약 7을 넘으면 실용적 탐색이 어렵다.
디스커션에서 저자는 세 가지 시사점을 제시한다. 아날로그 회로 응용으로 FPGA 또는 아날로그 하드웨어에서 균일한 이항 트리 토폴로지로 다변수 초등 함수를 구현할 수 있는 가능성, 신경망과의 평행성으로 표준 활성화 함수가 모두 초등 함수이므로 일반적인 신경망이 EML 트리 구조의 특수 사례로 볼 수 있다는 점, 그리고 상수 의존성을 제거할 수 있는 단일 univariate 또는 ternary 연산자 후보 탐색이 향후 과제다. 저자가 검토한 ternary 후보 중 하나는 T(x, y, z) = e^x / ln(x) × ln(z) / e^y이다.
결론
이 논문은 단일 이항 연산자 eml(x, y) = exp(x) − ln(y)와 상수 1만으로 과학용 계산기의 모든 표준 함수를 생성할 수 있음을 구성적으로 입증한다. 복잡도는 함수에 따라 K=3에서 K=75까지 비대칭하지만, 깊이 4까지는 경사 기반 기호 회귀로 학습 가능하며 perturbed 초기화에서는 깊이 6까지도 복구가 가능하다. 초등 함수가 기존 인식보다 훨씬 단순한 단일 원시 연산자의 닫힌 클래스라는 발견은 아날로그 회로, 데이터 기반 기호 발견, 신경망 활성화 함수 설계 등 여러 분야에 새로운 방향을 제시한다.