포스트

언어는 달라도 정보 전달 속도는 같다 초당 39비트의 보편성

목차

  1. 개요
  2. 연구 배경
  3. 방법론
  4. 핵심 결과
  5. 의미와 시사점
  6. 결론
  7. Reference

개요

Coupé, Oh, Dediu, Pellegrino가 Science Advances에 발표한 연구는 17개 언어에 걸쳐 인간의 정보 전달 속도가 놀랍도록 비슷하다는 사실을 정량적으로 입증했다. 일본어와 영어처럼 음절 종류 수가 1:11에 달하는 언어 사이에도, 발화 속도와 음절당 정보량이 서로를 보정하면서 평균 약 39비트/초로 수렴한다. 이는 언어 구조와 화자의 신경 인지 능력이 의사소통 압력 아래에서 형성한 피드백 루프의 결과로 해석된다.

연구 배경

언어는 보편적이지만 보편적 특성이라 부를 만한 것은 거의 없다. 세계 7,000여 개 언어는 음절 수, 음소 수, 성조 체계 등에서 큰 다양성을 보인다. Shannon 정보 이론에 따르면 음절 종류가 다르면 음절당 정보량도 달라지지만, 모든 자연 언어는 화자가 효율적으로 정보를 인코딩하고 전송하도록 돕는다.

왜 음절 단위인가

음소는 일상 발화에서 자주 누락되는 반면 음절은 비교적 안정적으로 유지된다. 형태소나 단어 단위는 언어별 분석에 의존해 교차 언어 비교가 어렵다. 신경과학적으로도 음절 시간 척도는 청각 피질 진동의 동조와 연결되어 발화 지각의 핵심 단위로 여겨진다.

17개 언어 데이터셋

연구진은 9개 어족, 17개 언어를 대상으로 했다.

어족언어
Indo-European카탈루냐어, 독일어, 영어, 프랑스어, 이탈리아어, 스페인어, 세르비아어
Sino-Tibetan표준 중국어, 광둥어
Japanese일본어
Korean한국어
Austroasiatic베트남어
Tai-Kadai태국어
Turkic터키어
Uralic핀란드어, 헝가리어
Basque바스크어

170명의 원어민 성인이 의미적으로 동일한 15개의 텍스트를 읽었고, 총 약 240,000 음절이 수집되었다.

방법론

발화 속도 측정

각 녹음마다 150ms 이상의 침묵을 제외한 총 발화 시간과 사전 표기 기준 음절 수를 구해 발화 속도(SR, syllables/s)를 계산했다. “probably”는 [pɹɑ.bə.bli]처럼 사전형 발음을 기준으로 3음절로 셌다. 이렇게 하면 화자가 일부 음절을 줄여 발음하더라도 신호 안에 인코딩된 정보량을 일관되게 측정할 수 있다.

정보 밀도 추정

별도의 대규모 텍스트 코퍼스에서 음절 조건부 엔트로피를 계산해 언어별 정보 밀도(ID, bits/syllable)를 추정했다. 정보 밀도와 발화 속도를 곱해 텍스트별·화자별 정보 전달률(IR, bits/s)을 산출했다. 선형 혼합 효과 모델에 잔차의 이분산성이 관찰되어, 평균과 분산을 동시에 모델링하는 GAMLSS를 채택했다.

핵심 결과

평균 39비트/초의 정보 전달률

지표평균표준편차변동계수
발화 속도 (SR)6.63 syllables/s1.1517.3%
정보 전달률 (IR)39.15 bits/s5.1013.0%

정보 밀도는 바스크어 4.8 bits/syllable에서 베트남어 8.0 bits/syllable까지 분포한다. 가장 느린 화자는 초당 4.3음절, 가장 빠른 화자는 초당 9.1음절을 발화했다. 그러나 IR은 음절 수, SR보다 언어 간 분산이 유의하게 작았다(모든 무작위화 검정 P<10⁻⁴).

발화 속도와 정보 밀도의 트레이드오프

ID가 SR에 미치는 효과는 강한 음의 관계로 나타났다(β=-0.89, P<2.2×10⁻¹⁶). 음절당 정보량이 적은 언어는 더 빠르게 말해지고, 정보가 많은 언어는 더 천천히 말해진다. Pearson r=-0.71, Spearman ρ=-0.70 수준의 상관이 관찰되었다. 또한 여성 화자는 남성보다 SR과 IR 모두에서 평균이 낮았다.

의미와 시사점

언어는 IR의 최적 영역에 안정적으로 머문다. “높은 정보 밀도-빠른 발화”는 화자에게는 조음과 계획 비용이 크고, 청자에게는 채널 용량을 초과해 처리 부담이 발생한다. “낮은 정보 밀도-느린 발화”는 한 턴이 길어져 작업 기억 부담이 늘고 인간 대화의 평균 턴 길이 2초를 무너뜨린다. 연구진은 이를 생물학적 최적 제어가 아닌 “good-enough” 제어 개념으로 해석한다. 청각 피질의 θ 진동 범위와 연결된 약 4.5 음절/초의 최적 구간 가설과도 정합된다.

이 결과는 화자의 발화 속도가 단순히 개인 특성이 아니라, 모국어와 인지 시스템 사이의 상호작용에 의해 부드럽게 제약된다는 점을 시사한다. 언어 변화로 IR이 최적 영역을 벗어나려 하면 공조음 같은 보상 메커니즘이 SR을 조정해 다시 끌어당긴다는 예측이 가능하다.

결론

17개 언어, 170명의 화자, 약 24만 음절 규모의 코퍼스에서 인간 발화의 정보 전달률은 약 39비트/초로 수렴했다. 언어 간 차이는 음절 정보량이나 발화 속도보다 IR에서 훨씬 작았다. 이는 언어가 생물학, 환경, 문화의 교차점에서 진행되는 다중 척도 의사소통 적소 구축 과정의 산물임을 보여준다.

Reference