생각만으로 말하고 노래하다: 0.01초 음성 BCI 최초 구현

과학&IT

빛조각 2025. 6. 13. 06:00

I. 연구 개요

대상 : 루게릭병(ALS) 발병으로 언어 능력을 상실한 45세 남성 1명
시스템 : 운동피질에 256개 전극(깊이 1.5 mm) 이식 → 10 ms 간격 신경전위 수집 → 딥러닝(Transformer)으로 음성 스펙트럼 실시간 합성
성과 :
- 지연 0.01 초
- 억양·강세·질문 억양·3음계 허밍 구현
- 발병 전 목소리를 학습해 ‘개인화 음색’ 복원

신경 신호 캡처
- 전극 배열이 운동피질의 발성 관련 뉴런 집단을 포착
- 400 Hz 대역폭-양자화로 잡음 최소화
지속 음성 예측
- 학습 대상은 ‘단어’가 아니라 입·후두·혀 근육의 소리 의도
- 10 ms마다 확률 분포를 출력해 연속 스펙트럼 생성
맞춤 음색 합성
- 환자 과거 인터뷰 2 시간 오디오를 TTS 모델에 투입
- 억양·강세 예측값을 합성 음색에 실시간 주입
언어 제약 해제
- 사전(dictionary) 없이 음향-기저 모델만으로 “aah, hmm” 같은 감탄사·새 단어 생성 가능

기간	예상 발전 단계
~2027	최소 침습(두개골 미천공) 전극 상용화, 지연 5 ms 목표
~2029	휴대형 합성 모듈 + 스마트폰 연동, 배터리 12 h 이상
2030 이후	멀티모달 BCI(얼굴 아바타·제스처) 통합, 언어장애 아동·뇌졸중 확대 적용

10 밀리초 만에 억양과 노래까지 재현한 이번 BCI는 논문 제목 그대로 자연스러운, 끊김 없는 대화의 문을 열었다. 남은 과제는 안전성과 윤리, 그리고 비용이다. 그러나 “생각이 곧 목소리”라는 가능성은 이제 환상이 아니라 임상 현실로 기록됐다.

Nature News – World first: brain implant lets man speak with expression and sing (2025-06-11)
UC Davis Health – First-of-its-kind technology helps man with ALS speak in real time (2025-06-11)
UC Berkeley Engineering – Brain-to-voice neuroprosthesis restores naturalistic speech (2025-03-31)
RAND Corporation – Silent Speech, Loud Questions: The Dawn of Brain-Computer Interfaces (2025-05-20)
NIH Research Matters – Brain-computer interface restores natural speech after paralysis (2025-05-12)