연구 > 연구성과 - KAIST 전기 및 전자공학부

노용만 교수 연구실 박세진 박사과정 학생 ‘스피치SSM’ 개발, 24시간 말하는 AI 비서 가능성 열어

< (왼쪽부터) 전기및전자공학부 노용만 교수, 박세진 박사과정 >

최근 음성 언어 모델(Spoken Language Model, SLM)은 텍스트 없이 인간의 음성을 학습해 음성의 언어적, 비언어적 정보를 이해 및 생성하는 기술로 텍스트 기반 언어 모델의 한계를 넘어서는 차세대 기술로 각광받고 있다. 하지만 기존 모델은 장시간 콘텐츠 생성이 요구되는 팟캐스트, 오디오북, 음성비서 등에서 한계가 두드러졌는데, 우리 연구진이 이런 한계를 뛰어넘어, 시간 제약 없이 일관되고 자연스러운 음성 생성을 실현한‘스피치SSM’을 개발하는데 성공했다.

우리 학부 노용만 교수 연구팀의 박세진 박사과정 학생이 장시간 음성 생성이 가능한 음성 언어 모델 ‘스피치SSM(SpeechSSM)’을 개발했다.

이번 연구는 국제 최고 권위 머신러닝 학회인 ICML(International Conference on Machine Learning) 2025에 전체 제출된 논문 중 약 1%만이 선정되는 구두 논문 발표에 확정돼 뛰어난 연구 역량을 입증할 뿐만 아니라 우리 학부의 인공지능 연구 능력이 세계 최고 수준임을 다시 한번 보여주는 계기가 될 전망이다.

음성 언어 모델(SLM)은 중간에 텍스트로 변환하지 않고 음성을 직접 처리함으로써, 인간 화자 고유의 음향적 특성을 활용할 수 있어 대규모 모델에서도 고품질의 음성을 빠르게 생성할 수 있다는 점이 큰 강점이다.

< 그림 1. SpeechSSM 개요. SpeechSSM의 하이브리드 상태공간 모델은 중첩된 고정 크기 윈도우로 인코딩된 의미 토큰(USM-v2)에 대해 LM 목표로 학습됨. 비자기회귀 방식의 음성 디코더(SoundStorm)는 중첩된 의미 토큰 윈도우를 화자 조건에 따라 음향 코덱(SoundStream)으로 변환함 >

그러나 기존 모델은 음성을 아주 세밀하게 잘게 쪼개서 아주 자세한 정보까지 담는 경우, ‘음성 토큰 해상도’가 높아지고 사용하는 메모리 소비도 증가하는 문제로 인해 장시간 음성의 의미적, 화자적 일관성을 유지하기 어려웠다.

연구팀은 이러한 문제를 해결하기 위해 하이브리드 상태공간 모델(Hybrid State-Space Model)을 사용한 음성 언어 모델인 ‘스피치SSM’를 개발해 긴 음성 시퀀스를 효율적으로 처리하고 생성할 수 있게 설계했다.

이 모델은 최근 정보에 집중하는 ‘어텐션 레이어(attention layer)’와 전체 이야기 흐름(장기적인 맥락)을 오래 기억하는‘순환 레이어(recurrent layer)’를 교차 배치한‘하이브리드 구조’를 통해 긴 시간 동안 음성을 생성해도 흐름을 잃지 않고 이야기를 잘 이어간다. 또한, 메모리 사용량과 연산량이 입력 길이에 따라 급격히 증가하지 않아, 장시간의 음성을 안정적이고 효율적으로 학습하고 생성할 수 있다.

스피치SSM은 음성 데이터를 짧은 고정된 단위(윈도우)로 나눠 각 단위별로 독립적으로 처리하고, 전체 긴 음성을 만들 경우에는 다시 붙이는 방식을 활용해 쉽게 긴 음성을 만들 수 있어 무한한 길이의 음성 시퀀스(unbounded speech sequence)를 효과적으로 처리할 수 있게 했다.

또한 음성 생성 단계에서는 한 글자, 한 단어 차례대로 천천히 만들어내지 않고, 여러 부분을 한꺼번에 빠르게 만들어내는 ‘비자기회귀(Non-Autoregressive)’ 방식의 오디오 합성 모델(SoundStorm)을 사용해, 고품질의 음성을 빠르게 생성할 수 있게 했다.

기존은 10초 정도 짧은 음성 모델을 평가했지만, 연구팀은 16분까지 생성할 수 있도록 자체 구축한 새로운 벤치마크 데이터셋인 ‘LibriSpeech-Long’을 기반으로 음성을 생성하는 평가 태스크를 새롭게 만들었다.

기존 음성 모델 평가 지표인 말이 문법적으로 맞는지 정도만 알려주는 PPL(Perplexity)에 비해, 연구팀은 시간이 지나면서도 내용이 잘 이어지는지 보는 ‘SC-L(semantic coherence over time)’, 자연스럽게 들리는 정도를 시간 따라 보는 ‘N-MOS-T(naturalness mean opinion score over time)’ 등 새로운 평가 지표들을 제안해 보다 효과적이고 정밀하게 평가했다.

< 그림 2. 다양한 음성 언어 모델(Spoken LM)에서 고려된 최대 시퀀스 길이. 기존 음성 언어 모델은 최대 200초 길이까지 학습 및 평가가 이루어졌으나, SpeechSSM은 16분 길이의 음성을 학습하고 평가할 수 있음. 본 연구의 모델은 일정한 메모리 사용으로 이론적으로 무한 길이 생성이 가능하지만, 실험에서는 평가를 위해 16분으로 제한함 >

새로운 평가를 통해 스피치SSM 음성 언어 모델로 생성된 음성은 긴 시간 생성에도 불구하고 초기 프롬프트에서 언급된 특정 인물이 지속적으로 등장하며, 맥락적으로 일관된 새로운 인물과 사건들이 자연스럽게 전개되는 모습을 확인했다. 이는 기존 모델들이 장시간 생성 시 쉽게 주제를 잃고 반복되는 현상을 보였던 것과 크게 대조적이다.

박세진 박사과정생은 “기존 음성 언어 모델은 장시간 생성에 한계가 있어, 실제 인간이 사용하도록 장시간 음성 생성이 가능한 음성 언어 모델을 개발하는 것이 목표였다”며“이번 연구 성과를 통해 긴 문맥에서도 일관된 내용을 유지하면서, 기존 방식보다 더 효율적이고 빠르게 실시간으로 응답할 수 있어, 다양한 음성 콘텐츠 제작과 음성비서 등 음성 AI 분야에 크게 기여할 것으로 기대한다”라고 밝혔다.

< 그림 3. 임베딩 유사도(SC-L)를 이용하여 측정한 10초 프롬프트와 16분 생성 결과의 100단어 구간 간 의미 유사도. 생성 길이가 길어짐에 따라 의미 일관성이 저하되는 기존 방법들과 달리 SpeechSSM은 실제 음성과 비슷한 추이로 의미 일관성을 유지함 >

이 연구는 제1 저자인 우리 대학 박세진 박사과정 학생이 구글 딥마인드(Google DeepMind)와 협력해,ICML(국제 머신러닝 학회) 2025에서 7월 16일 구두 발표로 소개될 예정이다.

※ 논문제목: Long-Form Speech Generation with Spoken Language Models

※ DOI: 10.48550/arXiv.2412.18603

한편, 박세진 박사과정생은 비전, 음성, 언어를 통합하는 연구를 수행하며 CVPR(컴퓨터 비전 분야 최고 학회) 2024 하이라이트 논문 발표, 2024년 ACL(자연어 처리 분야 최고 학회)에서 우수논문상(Outstanding Paper Award) 수상 등을 통해 우수한 연구 역량을 입증한 바 있다.

< 그림 4. SpeechSSM의 연산 효율성. (좌) TPU v5e에서 모델별 및 생성 길이별 배치 디코딩 최대 처리량 (우) TPU v5e에서 단일 샘플(batch size 1)을 목표 길이까지 디코딩하는 데 소요된 시간 >

[데모 페이지 링크]

https://google.github.io/tacotron/publications/speechssm/

전기및전자공학부 대학원생 3명, 제2기 대학원 대통령과학장학생 수혜자 선정

<왼쪽부터 노경하, 박석준, 임준택 박사과정 학생>

우리 학부 박사과정 노경하(지도교수 정준선), 박석준(지도교수 최진석), 임준택(지도교수 유민수) 학생이 제2기 대학원 대통령과학장학생 수혜자로 선정됐다.

노경하 학생은 멀티모달 자기지도학습, 멀티모달 인식 및 생성 모델 연구를 연구하고 있으며, 박석준 학생은 차세대 6G 통신을 위한 위성 및 다중접속기반 저전력 빔포밍 최적화 기술과 AI 기반 통합 센싱-통신 시스템의 예측 빔포밍 분야를 연구하고 있다. 임준택 박사과정학생은 하드웨어-소프트웨어 전 계층의 통합 보안을 통한 효율적이고 신뢰가능한 컴퓨팅 시스템을 구축하는 것을 목표로 연구하고 있다.

대학원 대통령과학장학금은 세계 최고 수준의 이공계 연구인력을 양성하기 위해 한국 장학재단이지난해 신설한 사업으로 최종 선발된 대학원 대통령과학장학생에게는 대통령 명의의 장학증서를 수여하고, 석사과정생 매월 150만원(연간 1,800만 원), 박사과정생 매월 200만원(연 2,400만원)의 장학금을 지급한다.

올해 대학원 대통령과학장학생 선발 경쟁률은 120명 모집에 2,355명이 지원해 약 20:1의 높은 경쟁률을 기록했다.

장동의 교수팀, VLA 기반 협동 로봇 간 물체 전달 시스템 개발로 ‘허깅페이스 LeRobot Worldwide Hackathon’ Third Prize 수상

<(왼쪽부터) 이경돈 석사과정, 권호준 석사과정, 권석준 석사과정, 장동의 교수, 장희덕 박사과정, Guining Pertin 석사과정>

우리 학부 장동의 교수 연구실의 ‘Team ACE’ 팀이 6월 14일부터 16일까지 3일 동안 진행된 ‘Hugging Face LeRobot Worldwide Hackathon’에서 우수한 성적으로 Third Prize를 수상하는 성과를 거두었습니다.

장동의 교수 연구실의 권석준 석사과정(팀장), 장희덕 박사과정, 권호준 석사과정, Guining Pertin 석사과정, 이경돈 석사과정으로 구성된 ‘Team ACE’는 VLA를 이용한 협동 로봇 간 물체 전달 시스템을 개발하여, 전 세계의 600개 이상의 팀 중 20위에 올라 Third Prize (6위~24위)를 수상하였습니다. 또한 국내 대구 지역 주최측으로부터 “한국로봇산업진흥원장상”을 동시에 수상하는 성과도 거두었습니다.

<‘Team ACE’ 팀이 개발한 VLA 기반 협동 로봇 간 물체 전달 시스템>

‘Hugging Face’는 미국의 인공지능 스타트업으로, 트랜스포머나 데이터셋과 같은 머신러닝 라이브러리 및 최근에는 로보틱스와 관련된 인공지능 자원도 활발히 제공하고 있는 세계 최대의 인공지능 플랫폼 중 하나입니다.

Hugging Face에서는 주기적으로 해커톤을 개최하며, 전세계의 연구자와 학생들이 AI와 관련된 다양한 아이디어로 서로의 실력을 겨루는 자리를 마련하고 있습니다.

이번 해커톤은 전 세계 45개국에서 2천 5백명 이상의 AI·로봇 전문가들이 동시에 참여한 ‘LeRobot Worldwide Hackathon‘ 으로, 로봇팔에 VLA (Vision Language Action) 모델, 강화학습 등을 적용하여 산업 및 일상 생활에서의 문제를 자유 주제로 해결하는 것을 목표로 이루어졌습니다.

‘Team ACE’는 해당 대회에서의 성과를 통해 전 세계의 로보틱스 커뮤니티 및 국내의 전문가들로 부터 기술력과 창의성을 인정받았습니다. 해당 대회와 ‘Team ACE’의 활약은 지역 언론의 주목을 받으며 활발히 보도되었습니다.

정명수-한동수 교수 연구팀, 차세대 연결/반도체 기술 관련 연구 결과 IEEE 마이크로(Micro)에 최다 공개

<정명수 교수님 연구팀>

우리 학부 정명수-한동수 교수님 연구팀의 차세대 연결/반도체 기술 연구 성과와 관련된 5편의 논문이 컴퓨터 아키텍처 분야 유수 저널인 IEEE 마이크로(Micro)에 동시에 채택되었습니다. 단일 기관이 학술지 한 권에 게재한 논문 수로는 역대 최다가 될 것으로 예상됩니다.

IEEE Micro는 1981년에 창간된 컴퓨터 아키텍처 및 반도체 기술 분야의 권위 있는 저널로, 학계 및 산업계 최신 연구 성과를 격월 간행의 형태로 소개하고 있습니다. 정명수-한동수 교수님 연구팀은 ‘캐시 일관성 보장 연결기술 및 자원 분리 (Cache Coherent Interconnects and Resource Disaggregation Technology)’가 주제로 다루어진 IEEE Micro 5-6월호에 총 5편의 논문을 공개할 예정입니다.

이번에 정명수 교수님 연구팀이 공개한 5편의 논문 중 3편은 차세대 고속 연결 기술인 컴퓨트익스프레스링크(Compute Express Link, CXL)를 스토리지에 접목시킨 내용을 다루고 있습니다. 특히 연구팀은 정명수 교수님이 앞서 2022년도에 개념과 실질적인 구현 방안을 제안한 바 있는 솔루션인 CXL-SSD의 성능을 개선하는 연구를 진행하였는데, 해당 기술을 활용하면 대용량의 SSD를 메모리처럼 활용하면서, 동시에 DRAM 메모리와 비교 가능한 수준의 성능을 제공할 수 있습니다.

〈IEEE Micro 5/6월호를 통해 공개되는 논문 목록〉

정명수 교수님 연구팀은 뿐만 아니라 인-스토리지 프로세싱(In-Storage Processing, ISP) 기술을 적용한 스토리지 관련 연구 또한 수행하였습니다. 해당 연구는 여러 대의 스토리지 장치로 구성된 스토리지 풀(pool) 내부에서 직접 연산을 수행하는 솔루션으로, 불필요한 데이터 이동을 최소화하여 대규모 언어 모델(Large Language Model, LLM)과 같은 대형 응용을 효율적으로 가속할 수 있습니다. 이 외에도 GPU 메모리 용량을 확장하기 위한 스토리지 기반 솔루션 관련 연구, 우리 학부 한동수 교수님 연구팀과 공동으로 진행한 인공신경망 기반의 클라우드 스토리지 관련 연구 등이 이번 IEEE Micro 5-6월호에 채택되었습니다.

한편, 교원창업기업 파네시아와 공동 연구의 형태로 진행된 이번 논문들은 IEEE Micro 공식 웹사이트 및 정기 간행본을 통해 공개될 예정입니다.

※ 제목을 클릭하면 선공개된 논문으로 이동합니다.

제민규 교수 연구실 천송이 박사과정, IEEE CASS Pre-Doctoral Grant 수혜자 선정

<(왼쪽) 천송이 박사과정 학생>

우리 학부 제민규 교수 연구실의 천송이 박사과정 학생이 2025년도 IEEE Circuits and Systems Society (CASS) Pre-Doctoral Grant 수혜자로 선정되었습니다.

CASS Pre-Doctoral Grant는 시스템 반도체 회로 설계 분야에서 뛰어난 연구 성과를 보인 전 세계 박사과정 학생들에게 주어지는 특별한 지원으로, 매년 소수의 학생만이 선정됩니다. 올해는 전 세계에서 단 4명만이 선정되었으며, 천송이 학생이 그 중 한 명으로 이름을 올렸습니다.

천송이 학생은 ISSCC 논문 1편(공동 제1저자), IEEE 저널 논문 4편(제1저자 또는 공동 제1저자)을 포함해 총 19편의 국제 논문을 발표했으며, 이 중 9편은CASS가 주관하는 저널 및 학회에 게재되었습니다. 특히 임피던스 측정 회로의 최적화, 높은 정확도, 저전력 설계 등에서의 기여가 높이 평가되어 이번 지원 대상자로 선정되었습니다.

성영철 교수 연구실 김정혜 박사과정생 AI로 산업 현장 최적화 기여

<김정혜 박사과정 학생>

거대언어모델, 자율주행 및 휴머노이드 로봇과 더불어 산업 제조 현장 최적화는 AI의 또다른 중요한 응용 분야이다.

성영철 교수 연구실 김정혜 박사과정생은 2024년 LG AI 연구원 강화학습팀에 인턴으로 참여하여, LG 그룹 제조 현장에서 일어나는 다양한 제조 공정 최적화 문제에 접할 수 있었다. 이 팀은 LG 화학 대산 나프타 분해 시설(NCC) 공정을 최적화하여 생산효율을 3% 증진시켜 연간 100억의 추가 이득을 달성한 팀이다.

이 공정 최적화는 강화학습을 기반으로 하고 있다. 특히, 생산 시설에서의 강화학습은 환경과 직접 상호작용하면서 학습을 진행하기가 어렵기에 이미 축적된 데이터로 알고리즘을 최적화하는 오프라인 강화학습이 필수이다.

김정혜 학생은 이 오프라인 강화학습 문제에서 기존 방식과는 달리 신경망의 분해능을 증가시켜 인샘플데이터와 분포외데이터를 쉽게 구분하여 오프라인 강화학습의 주된 난제인 Q 값 발산을 해결하여 기존 방식보다 월등히 뛰어난 오프라인 강화학습 알고리즘을 개발에 주도적 역할을 하여 앞으로 강화학습을 이용한 생산 공정 최적화에 크게 기여하였다.

이 연구 결과는 International Conference on Machine Learning (ICML) 2025에서 spotlight 논문으로 발표될 예정이다.

관련 연합 뉴스 기사 링크: https://www.yna.co.kr/view/AKR20250613153400003

권경하 교수팀, 배터리 없이 이산화탄소 실시간 모니터링 성공

< (왼쪽부터) 장규림 석사과정, 권경하 교수 >

기후 변화와 지구온난화를 막기 위해서는 이산화탄소(CO2)가 ‘얼마나’ 배출되고 있는지를 정확히 파악하는 것이 핵심이다. 이를 가능하게 하는 것이 바로 이산화탄소 모니터링 기술이다. 최근 한국 연구진이 외부 전력 없이도 이산화탄소 농도를 실시간 측정하고 무선으로 전송할 수 있는 시스템을 개발해 환경 모니터링 기술의 새로운 가능성을 열었다.

우리 학부 권경하 교수 연구팀이 중앙대학교 류한준 교수팀과 공동연구를 통해, 주변의 미세 진동 에너지를 수확해 이산화탄소 농도를 주기적으로 측정할 수 있는 자가발전형 무선 모니터링 시스템을 개발했다.

지구온난화의 주요 원인인 이산화탄소 배출은 산업계의 지속가능성 평가 지표로 자리 잡고 있으며, 유럽연합(EU)은 이미 공장 배출량 규제를 도입한 상태다. 이러한 규제 흐름에 따라, 효율적이고 지속 가능한 이산화탄소 모니터링 시스템은 환경 관리와 산업 공정 제어에 필수적인 요소로 주목받고 있다.

그러나 기존 이산화탄소 모니터링 시스템은 대부분 배터리나 유선 전원에 의존하기 때문에 설치와 유지보수에 제약이 따른다. 연구팀은 이 문제를 해결하기 위해, 외부 전력 없이 작동 가능한 자가발전 무선 이산화탄소 모니터링 시스템을 개발했다.

이번 시스템의 핵심은 산업 장비나 배관에서 발생하는 진동(20~4000㎛ 진폭, 0-300 Hz 주파수 범위)을 전기로 바꾸는 ‘관성 구동(Inertia-driven) 마찰전기 나노발전기(Triboelectric Nanogenerator, TENG)’이다. 이를 통해 배터리 없이도 이산화탄소 농도를 주기적으로 측정하고 무선으로 전송할 수 있다.

< 그림 1. 미세 진동 수확을 통한 자가발전 무선 CO2 모니터링 시스템 개념 및 구성 (a) 시스템 블록 다이어그램 (b) 제작된 시스템 프로토타입 사진 >

연구팀은 4단 적층 구조의 관성 구동 마찰전기 나노발전기(TENG)에 탄성 스프링을 결합해 미세 진동을 증폭시키고 공진 현상을 유도, 13Hz, 0.56g의 가속도 조건에서 0.5㎽의 전력을 안정적으로 생산하는 데 성공했다. 생산된 전력은 이산화탄소 센서와 저전력 블루투스 통신 시스템을 구동하는 데 사용됐다.

권경하 교수는 “효율적인 환경 모니터링을 위해서는 전원 제약 없이 지속적으로 작동 가능한 시스템이 필수”라며, “이번 연구에서는 관성 구동 마찰전기 나노발전기(TENG)로부터 생성된 에너지를 바탕으로 주기적으로 이산화탄소 농도를 측정하고 무선으로 전송할 수 있는 자가발전 시스템을 구현했다”고 설명했다.

이어 “이 기술은 향후 다양한 센서를 통합한 자가발전형 환경 모니터링 플랫폼의 기반 기술로 활용될 수 있을 것”이라고 덧붙였다.

< 그림 2. TENG 에너지 하베스트 기반 무선 CO2 센싱 시스템 구동 결과 (c) 실험 환경 셋업 (d) 실제 CO2 측정 결과 >

이번 연구 결과는 우리 대학 석사과정 장규림 학생과 중앙대 석사과정 다니엘 마나예 티루네(Daniel Manaye Tiruneh) 학생이 공동 제 1저자로 국제 저명 학술지 `나노 에너지(Nano Energy) (IF 16.8)’에 6월 1일자로 게재됐다.

※논문명 : Highly compact inertia-driven triboelectric nanogenerator for self-powered wireless CO2 monitoring via fine-vibration harvesting

※DOI: https://doi.org/10.1016/j.nanoen.2025.110872

이번 연구는 사우디 아람코-KAIST CO2 관리 센터의 지원을 받아 수행됐다.

김용대 · 윤인수 교수팀, 금융 필수 보안 소프트웨어의 해킹 악용 가능성 밝혀

< 연구진 사진(윗줄 왼쪽부터) 김용대 교수, 윤인수 교수, 김형식 교수, 김승주 교수 (아랫줄 왼쪽부터) 윤태식 연구원, 이용화 연구원, 정수환 연구원>

우리나라는 금융 보안 소프트웨어 설치를 의무화한 유일한 국가다. 이것이 오히려 보안 위협에 취약할 수도 있다는 우려가 우리 학부 연구진에 의해 밝혀졌다. 연구진은 안전한 금융 환경을 위한 현재 복잡하고 위험한 보안 프로그램을 강제로 설치하는 방식 대신, 웹사이트와 인터넷 브라우저에서 원래 설정한 안전한 규칙과 웹 표준을 따르는 ‘근본적 전환’이 필요하다고 설명했다.

우리 학부 김용대·윤인수 교수 공동 연구팀이 고려대 김승주 교수팀, 성균관대 김형식 교수팀, 보안 전문기업 티오리(Theori) 소속 연구진이 공동연구를 통해, 한국 금융보안 소프트웨어의 구조적 취약점을 체계적으로 분석한 연구 결과를 알렸다.

연구진은 북한의 사이버 공격 사례에서 왜 한국의 보안 소프트웨어가 주요 표적이 되는지에 주목했다. 분석 결과, 해당 소프트웨어들이 설계상의 구조적 결함과 구현상 취약점을 동시에 내포하고 있음이 드러났다. 특히 문제는, 한국에서는 금융 및 공공서비스 이용 시 이러한 보안 프로그램의 설치를 의무화하고 있다는 점이다.

이는 전 세계적으로도 유례가 없는 정책이다. 연구팀은 국내 주요 금융기관과 공공기관에서 사용 중인 7종의 주요 보안 프로그램(Korea Security Applications, 이하 ‘KSA 프로그램’)을 분석해 총 19건의 심각한 보안 취약점을 발견했다. 주요 취약점은 ▲키보드 입력 탈취 ▲중간자 공격(MITM) ▲공인인증서 유출 ▲원격 코드 실행(RCE) ▲사용자 식별 및 추적 이다.

일부 취약점은 연구진의 제보로 패치됐으나, 전체 보안 생태계를 관통하는 근본적 설계 취약점은 여전히 해결되지 않은 상태다. 연구진은 “이러한 보안 소프트웨어는 사용자의 안전을 위한 도구가 되어야 함에도 오히려 공격의 통로로 악용될 수 있다”며, 보안의 근본적 패러다임 전환이 필요하다고 강조했다.

연구팀은 국내 금융보안 소프트웨어들이 웹 브라우저의 보안 구조를 우회해 민감한 시스템 기능을 수행하도록 설계됐다고 지적했다. 브라우저는 원칙적으로 외부 웹사이트가 시스템 내부 파일 등 민감 정보에 접근하지 못하도록 제한하지만, KSA는 키보드 보안, 방화벽, 인증서 저장으로 구성된 이른바 ‘보안 3종 세트’를 유지하기 위해 루프백 통신, 외부 프로그램 호출, 비표준 API 활용 등 브라우저 외부 채널을 통해 이러한 제한을 우회하는 방식을 사용하고 있다.

이러한 방식은 2015년까지는 보안 플러그인 ActiveX를 통해 이뤄졌지만, 보안 취약성과 기술적 한계로 ActiveX 지원이 중단되면서 근본적인 개선이 이뤄질 것으로 기대됐다. 그러나 실제로는 실행파일(.exe)을 활용한 유사한 구조로 대체되면서, 기존의 문제를 반복하는 방식으로 이어졌다. 이로 인해 브라우저 보안 경계를 우회하고, 민감 정보에 직접 접근하는 보안 리스크가 여전히 지속되고 있다.

이러한 설계는 ▲동일 출처 정책(Same-Origin Policy, SOP)* ▲샌드박스** ▲권한 격리*** 등 최신 웹 보안 메커니즘과 정면으로 충돌한다. 연구팀은 실제로 이러한 구조가 새로운 공격 경로로 악용될 수 있음을 실증적으로 확인했다.

*Same-Origin Policy(SOP, 동일 출처 정책): 웹 보안의 핵심 개념 중 하나로, 서로 다른 출처(origin)의 웹 페이지나 스크립트 간에 데이터에 접근하지 못하도록 제한하는 보안 정책

**샌드박스(Sandbox): 보안과 안정성을 위해 시스템 내에서 실행되는 코드나 프로그램의 활동을 제한된 환경 안에 가두는 기술

***권한 격리(Privilege Separation): 시스템 보안을 강화하기 위해, 프로그램이나 프로세스를 여러 부분으로 나누고 각각에 최소한의 권한만 부여하는 보안 설계 방식

연구팀이 전국 400명을 대상으로 실시한 온라인 설문조사 결과, 97.4%가 금융서비스 이용을 위해 KSA를 설치한 경험이 있었으며, 이 중 59.3%는 ‘무엇을 하는 프로그램인지 모른다’고 응답했다. 실제 사용자 PC 48대를 분석한 결과, 1인당 평균 9개의 KSA가 설치돼 있었고 다수는 2022년 이전 버전이었다. 일부는 2019년 버전까지 사용되고 있었다.

김용대 교수는 “문제는 단순한 버그가 아니라, ‘웹은 위험하므로 보호해야 한다’는 브라우저의 보안 철학과 정면으로 충돌하는 구조”라며 “이처럼 구조적으로 안전하지 않은 시스템은 작은 실수도 치명적인 보안 사고로 이어질 수 있다”고 강조했다.

이어 “이제는 비표준 보안 소프트웨어들을 강제로 설치시키는 방식이 아니라, 웹 표준과 브라우저 보안 모델을 따르는 방향으로 전환해야 한다”며, “그렇지 않으면 KSA는 향후에도 국가 차원의 보안 위협의 중심이 될 것”이라고 덧붙였다.

우리 학부 김용대·윤인수 교수, 고려대 김승주 교수, 성균관대 김형식 교수가 연구를 주도했으며, 제1 저자인 윤태식 연구원<(주)티오리/KAIST>을 비롯해 정수환<(주)엔키화이트햇/KAIST>, 이용화<(주)티오리> 연구원이 참여했다. 세계 최고 권위의 보안 학회 중 하나인 ‘유즈닉스 시큐리티 2025(USENIX Security 2025)’에 채택됐다고 2일 밝혔다.

※ 논문명: Too Much of a Good Thing: (In-)Security of Mandatory Security Software for Financial Services in South Korea

※ 논문원문: https://syssec.kaist.ac.kr/pub/2025/Too_Much_Good.pdf

이번 연구는 정보통신기획평가원(IITP)의 RS-2024-00400302, RS-2024-00438686, RS-2022-II221199 과제의 지원을 받아 수행됐다.

설명: 피해자가 해킹 사이트에 접속하게 되면 해킹 사이트는 설치된 키보드 보안 프로그램과 통신하여 피해자가 입력하는 키보드 입력을 가로채어 자신에게 전송하도록 설정할 수 있음. 이로 인해 피해자가 입력하는 키보드 입력들이 비밀번호 입력까지도 해커에게 전송됨. 일반적으로 웹 페이지에서 다른 프로그램이나 다른 사이트에 입력하는 키보드 입력을 가로채는 것이 불가능하지만 KSA를 이용해 키보드 입력을 가로챌 수 있음.

설명: 피해자가 해킹 사이트에 접속하게 되면 해킹 사이트는 KSA와 통신하여 피해자의 PC에 악성 파일을 다운로드 시킬 수 있고, 해당 파일을 이용해 민감한 저장소에 악성 프로그램을 설치할 수 있음. 설치된 악성 프로그램은 피해자가 PC를 재부팅하면 실행되며 해커가 원하는 코드를 임의로 실행할 수 있음. 데모 동영상에서는 단순히 해커가 원하는 코드를 실행할 수 있음을 보이기 위해 계산기 프로그램을 실행하였지만 실제 상황에서는 백도어 등을 해커가 피해자 PC에 설치할 수 있음. 일반적으로 웹페이지에서 시스템에서 동작하는 코드를 실행하는 것은 불가능하지만 KSA의 취약성을 이용해 시스템에서 동작하는 코드를 실행하여 악성 행위를 할 수 있음.

유출된 KSA의 사설 RootCA 비밀키를 이용해 피싱 사이트에 google.com 도메인을 위조해 TLS 인증서를 생성한 사례로, 브라우저는 이를 ‘신뢰된 연결’로 표시하고 있어 사용자가 실제와 구분하기 어려움. 피해자는 이 표시를 믿고 가짜 사이트에 개인정보나 비밀번호 등을 입력하게 되며, 이로 인해 계정 탈취 등의 보안 피해로 이어질 수 있음. 일반적으로 공인된 인증 기관에서 발급된 TLS 인증서만이 브라우저에서 ‘신뢰된 연결’로 표시되나 KSA의 미흡한 구조와 키 관리로 인해 TLS 인증서를 위조할 수 있음.

정재웅 교수 연구팀, 온도 따라 강성을 전환할 수 있는 액체금속 전자잉크 개발

<(왼쪽부터) 정재웅 교수, 이시목 박사과정 학생 >

스마트폰 같은 딱딱한 전자기기는 안정적인 성능을 제공하지만 착용시 불편함을 주는 반면, 얇고 유연한 웨어러블 기기는 착용감은 뛰어나지만 부드러운 특성 때문에 정밀한 조작에 한계가 있다. 국내 연구진이 온도에 따라 딱딱함과 부드러움을 자유자재로 전환할 수 있는 ‘액체금속 전자잉크’를 개발해, 가변강성을 갖춘 전자기기의 새로운 패러다임을 열고 있다.

< 대표 이미지 >

우리 학부 정재웅 교수 연구팀이 서울대 박성준 교수 연구팀, 우리 대학 신소재공학과 스티브 박 교수 연구팀과 공동연구를 통해, 상온에서 마이크로 스케일(머리카락보다 얇은 구조)의 미세 선폭 회로 인쇄가 가능하고 온도에 따라 딱딱함과 부드러움을 자유자재로 조절할 수 있는 액체금속 전자잉크를 개발했다.

연구팀이 개발한 전자잉크는 정밀한 인쇄가 가능한 물성과 우수한 전기전도성을 동시에 갖추고 있으며, 딱딱함과 부드러움을 자유자재로 조절할 수 있는 전자소자를 상온에서 정밀 제작할 수 있는 획기적인 기술이다.

이 전자잉크는 상용 인쇄회로 기판(PCB) 수준의 복잡한 고해상도 다층 회로 인쇄가 가능하며, 완성된 전자기기는 온도에 반응해 딱딱한 형태를 유연하게 변화시킬 수 있다.

< 그림 1. 마이크로 크기의 갈륨 입자를 고분자 매트릭스에 분산시켜 안정적인 고점성 전자잉크를 제작하는 과정 (좌). pH 제어 화학 소결을 통한 고해상도 대면적 회로 인쇄 과정 (우).>

연구팀은 기존 전자기기의 고정된 형태의 한계를 극복하기 위해 체온 근처(29.8 ℃)에서 녹는 액체금속 갈륨에 주목했다. 갈륨은 고체 상태에서는 매우 단단하지만 녹으면 부드러운 액체가 돼 큰 폭의 강성 변화가 가능하다. 하지만 기존 갈륨은 물방울처럼 뭉치려는 성질(높은 표면장력)과 액체 상태에서의 불안정성 때문에 정밀한 회로 제작이 어려웠고, 제조 과정에서 원치 않는 상변화가 일어나는 문제가 있었다.

이러한 갈륨의 한계를 극복하기 위해 산성도(pH) 제어 기반 액체금속 전자 잉크 프린팅 기술을 개발했다.

먼저, 마이크로 크기의 갈륨 입자를 디메틸 설폭사이드(Dimethyl Sulfoxide, 이하 DMSO)라는 중성 용매에 친수성 폴리우레탄 고분자와 함께 섞어 전자 잉크를 제작했다. 이때 DMSO 용매의 중성 상태 덕분에 갈륨 입자들이 고분자 매트릭스에 골고루 분산된 안정적인 고점성 잉크가 형성되며, 이를 통해 상온에서 고해상도 회로 인쇄가 가능해진다.

그리고 인쇄 후에는 가열 과정에서 DMSO 용매가 분해되면서 산성 물질을 생성하고, 이 산성 환경에서 갈륨 입자들 표면의 산화막이 제거돼 입자들이 물리적으로 연결되면서 전기가 통하고 강성을 조절할 수 있는 회로가 형성된다.

< 그림 2. 전자잉크의 주요 특징. (i) 고해상도 인쇄 및 다층 집적 가능. (ii) 대면적 스크린 프린팅을 통한 대량 생산 가능. (iii) 딥 코팅을 통한 복잡한 3차원 구조 인쇄 가능. (iv) 우수한 전기전도도와 강성도 조절 가능. >

연구팀은 이러한 2단계 공정을 통해 상온에서는 안정적인 인쇄가 가능하면서도 완성 후에는 우수한 전기전도성과 가변강성 특성을 갖는 전자소자를 구현할 수 있었다.

개발된 전자잉크는 머리카락 굵기의 절반 (약 50μm)인 미세 선폭으로 정밀한 회로를 인쇄할 수 있으며, 우수한 전기전도도(2.27×10⁶ S/m)와 함께 1,465배나 되는 강성 조절 비율을 제공한다. 이는 플라스틱처럼 딱딱한 상태에서 고무처럼 말랑한 상태까지 자유자재로 변할 수 있음을 뜻한다.

또한 스크린 프린팅, 딥 코팅 등 기존 인쇄 방법들과 호환돼 고해상 대면적 회로 제작은 물론 복잡한 3차원 형태의 다양한 전자기기 제작을 가능하게 한다.

< 그림 3. 상용 인쇄회로 기판 (PCB) 수준의 고해상도 회로와 다층 구조를 갖는 가변강성 웨어러블 전자기기. 상온에서는 딱딱한 휴대용 전자기기로 사용되다가 피부 부착 시 체온에서 부드러워져 웨어러블 헬스케어 기기로 변환. >

연구팀은 이 기술을 활용해 평상시에는 딱딱한 휴대용 전자기기로 사용하다가 몸에 착용하면 부드러운 웨어러블 헬스케어 기기로 변환되는 가변형 다목적 기기를 개발했다. 뿐만 아니라, 수술 시에는 딱딱한 상태로 정밀한 조작과 뇌 삽입이 가능하지만 뇌 조직 내에서는 부드럽게 변해 조직 내 염증반응을 최소화하는 뇌 탐침을 구현함으로써 이식용 소자로서의 활용 가능성도 입증했다.

< 그림 4. 입체 구조의 광 도파로에 전자잉크를 코팅하여 구현한 체온 반응형 가변강성 뇌 이식 프로브. (좌) 수술 시에는 딱딱한 상태로 정밀한 조작과 뇌 삽입이 가능하고 삽입 후 체내에서는 부드럽게 변해 뇌의 기계적 스트레스를 최소화 하고 생체 적합성을 크게 향상 시킴. (우)>

정재웅 교수는 “전자 잉크 용매의 산성도 조절을 통해 갈륨 입자들을 전기·기계적 연결하는 독창적 기술로 액체금속 프린팅의 고질적인 문제를 해결하고 상온에서 초정밀 고해상 회로 제작을 가능하게 한 것이 이번 연구의 핵심”이라며 “하나의 기기가 상황에 따라 딱딱한 상태와 부드러운 상태로 자유자재로 변환될 수 있어 다목적 전자기기, 의료 기술, 로봇 분야 등에서 다양한 응용이 가능할 것”이라고 말했다.

전기및전자공학부 이시목 박사과정 학생과 부산대 이건희 교수가 공동 제1 저자로 참여한 이번 연구는 국제 학술지 ‘사이언스 어드밴시스(Science Advances)’에 5월 30일 字에 게재됐다.(논문명 : Phase-Change Metal Ink with pH-Controlled Chemical Sintering for Versatile and Scalable Fabrication of Variable Stiffness Electronics, DOI/10.1126/sciadv.adv4921)

한편 이번 연구는 과학기술정보통신부에서 추진하는 한국연구재단 중견연구지원사업, 기초연구실지원사업, 보스턴-코리아 공동연구 프로젝트, BK21 FOUR 사업의 지원을 받아 수행됐다.

명현 교수팀, 세계적 권위 로봇 학술대회서 챌린지 우승

< 왼쪽부터 김대범 박사과정(팀장), 이승재 박사과정, 장서연 박사과정, 공제이 석사과정, 명현 교수 >

우리 대학 전기및전자공학부 명현 교수 연구실의 어반 로보틱스 랩(Team Urban Robotics Lab)이 5월 19일부터 23일까지 미국 애틀랜타에서 열린 세계 최고 귄위의 로봇 학술대회인 2025 IEEE 국제 로봇 및 자동화 학술대회(International Conference on Robotics and Automation, ICRA)에서 개최된 NSS 챌린지(Nothing Stands Still Challenge) 2025에서 종합 1위를 차지하는 쾌거를 달성했다.

NSS 챌린지는 리히텐슈타인 국적의 글로벌 건설회사인 힐티(HILTI)사와 미국 스탠퍼드대 그래디언트 스페이스 그룹(Gradient Spaces Group)이 공동 주최하였고, 2021년도부터 개최되던 힐티 SLAM(Simultaneous Localization and Mapping)* 챌린지의 확장 버전으로 국제 로봇 및 자동화 학술대회(ICRA)에서 가장 저명한 챌린지 중 하나로 꼽힌다. *SLAM: 동시적 위치 추정 및 지도작성을 의미하며, 로봇이나 드론, 자율주행차 등이 자신의 위치를 파악하고 주변 환경의 지도를 동시에 생성하는 기술

< 우승 수상팀 기술에 대한 구두 강연 장면(연사 이승재, 장서연 박사과정) >

이번 챌린지는 건설 및 산업 환경과 같이 구조적 변화가 빈번한 상황에서, 다양한 시간대에 수집된 라이다 스캔 데이터를 얼마나 정확하고 강인하게 정합할 수 있는지를 중심으로 평가한다. 특히 단일 시점 정합 정확도만을 보는 것이 아니라 다수의 시간대에 걸쳐 발생하는 구조 변화에도 대응하는 다중 세션 위치추정 및 지도작성(Multi-session SLAM) 기술을 다루어, 기술적 수준이 매우 높은 대회로 손꼽힌다.

어반 로보틱스랩팀은 다중 시간대와 공간에서 수집된 라이다 데이터 간의 정합 문제를 해결하는 독자적인 위치 추정 및 지도작성 기술로 3위 대만국립대학교와 2위인 중국 서북 이공대를 큰 점수 차이로 제치고 전체 1위를 차지했다. 수상팀에게는 상금 4,000달러가 수여될 예정이다.

< 다수의 스캔을 정합하는 다중 정합(multiway-registration)의 예시 >

어반 로보틱스랩팀은 사전 연결 정보 없이도 다수의 스캔을 강건하게 정합할 수 있는 다중 정합(multiway-registration) 프레임워크를 자체 개발하였다. 이 프레임워크는 스캔 내의 특징점을 요약하고 대응점을 찾아내는 알고리즘(CubicFeat), 찾아낸 대응점을 기반으로 전역 정합을 수행하는 알고리즘(Quatro), 그리고 변화 감지 기반 결과 정제를 위한 알고리즘(Chamelion)으로 구성된다. 이러한 기술 조합을 통해 변화가 심한 산업 환경에서도 고정 구조물 기반으로 정합 성능이 안정적으로 구현하도록 하였다.

< Chamelion 알고리즘을 활용한 변화 감지 예시 >

라이다 스캔 정합 기술은 자율주행차, 자율로봇, 자율보행 시스템, 자율비행체, 자율운항 등 다양한 자율 시스템에서의 SLAM(Simultaneous Localization And Mapping)의 핵심 요소다.

명현 전기및전자공학부 교수는 “이번 수상 기술은 복잡한 환경 속에서도 서로 다른 스캔 사이의 상대 위치를 정밀하게 추정하는 성능을 극대화했다는 점에서 학문적 가치와 산업 응용 가능성을 동시에 입증한 사례로 평가된다.”라며 “난이도가 높아 많은 팀들이 포기한 상황에서도 끝까지 포기하지 않고 도전해 준 학생들에게 감사하다”고 밝혔다.

< 대회 결과 보드, 오차(RMSE)가 적을 수록 높은 점수임. (단위: 미터) >

한편, 어반 로보틱스랩팀은 2022년에 처음 SLAM 챌린지에 출전하여 학계 2위를 수상하고, 2023년에는 라이다 부문 전체 1위, 비전 부문 학계 1위를 수상한 바 있다.

[보관함:] 연구 > 연구성과