인터넷전화는 전화나 컴퓨터 사용자들이 기존 공중전화망 대신 인터넷망을 이용해 실시간으로 통화하는 전화기술이다. 미국 보컬텍이 관련 소프트웨어(SW)를 첫 발표한 후 현재까지 20여개의 관련SW가 소개됐다. 인터넷전화의 가장 큰 장점은 저렴한 가격을 꼽을 수 있다. 인터넷전화의 요금은 통화시간에 영향을 받지 않아 기존 전화통화료의 25%에 불과하며 특히 국제통화는 비교할 수 없을 정도로 싸다.
인터넷전화의 서비스 모드는 세가지로 나눌 수 있다.
첫째, 컴퓨터 대 컴퓨터 모드로 통화자 모두가 마이크와 스피커(사운드카드 포함)를 가지고 컴퓨터로 통화하는 형태다.
둘째, 컴퓨터 대 전화 혹은 전화 대 컴퓨터 모드로 동작하는 것으로 컴퓨터와 전화 사이, 즉 인터넷망과 공중전화망간의 다리역할을 하는 게이트웨이를 이용하는 방식이다.
셋째, 전화 대 전화 모드로 동작하는 형태다. 전화 사용자가 전화를 걸면 가장 가까운 게이트웨이로 연결돼 인터넷을 통해 수신자와 가까운 또다른 게이트웨이까지 전송된다. 수신측 게이트웨이에서는 다시 공중전화망을 이용해 수신자에게 음성데이터를 전송하는 만큼 전화 사용자들은 인터넷을 의식하지 않고 통화할 수 있다. 특히 미국 인터리니어텍(ILT)은 최근 넷박스라는 소형 장치를 전화기에 부착, 가정에서 인터넷망을 이용하는 기술을 개발했다.
기존전화통화료 75% 절감 인터넷전화의 핵심기술은 크게 음성코딩, 실시간 데이터전송, 손실패킷 복구, 게이트웨이기술 등 네가지로 요약할 수 있다. 이밖에도 인터넷전화를 위해서는 반향제거기술, 전송지연차 감소기술, 디렉터리 서비스기술, 화이트보드나 메시지 남김 등의 부가적 서비스기술 등이 필요하다.
음성코딩 및 압축기술은 인터넷전화와 같은 실시간 오디오, 특히 음성데이터 전송시스템 요소기술 중의 하나다. 인터넷 상 패킷손실이 기본적으로 패킷크기와 전송률 등에 영향을 받고 음질 또한 코딩방법에 따라 차이가 있기 때문에 인터넷전화에서는 실시간 인코딩 및 디코딩 조건 이외에도 저비트율, 고압축률, 고음질이라는 목적을 만족시키는 음성코딩기술이 개발돼야 한다.
음성코딩기술은 파형코딩, 보코딩, 하이브리드코딩 방식으로 나눌 수 있다. 현재 개발된 코딩기술은 PCM, ADPCM, GSM, LPC 등으로 다양하다. 비트율이 64kbps인 PCM, 32kbps인 ADPCM은 각각 G.711과 G.721로 표준화돼 있다. 유럽 이동통신분야에서 많이 사용되는 GSM은 비트율이 13kbps, 보코딩의 대명사격인 LPC는 2.4kbps에서부터 7kbps, 32kbps 등 버전별로 다양하게 개발돼 있다.
GSM의 경우 한 프레임인 20㎳를 8㎑로 샘플링해 8비트로 양자화한 1백60바이트를 33바이트로 압축하므로 초당 1천6백50바이트를 갖게 되며 이를 비트율로 환산하면 13.2kbps로 계산되는 것이다. 물론 프레임 크기도 10㎳, 20㎳, 30㎳, 40㎳ 등으로 다양하기 때문에 두가지 이상의 코딩방법을 함께 사용할 때 프레임 크기를 고려해야 한다.
또 표본화율과 양자율이 다양해 재생 후 음질의 차이가 크지만 8㎑, 8비트 양자화가 가장 일반적이다. 현재 인터넷으로는 많은 대역폭을 보장받을 수 없는 만큼 인터넷전화의 코딩은 가능하면 고압축률을 가진 것이어야 한다. 현재 가장 널리 채택되고 있는 코딩방법으로는 실시간 인코딩과 디코딩 SW가 구현되는 ADPCM, GSM이며 잉여패킷용으로는 저비트 고압축률을 가진 LPC가 이용되고 있다.
코딩된 데이터를 인터넷을 통해 실시간으로 전송하는 기술인 RTP(Realtime Transport Protocol)는 지난 95년 11월 22일 IESG로부터 인터넷 제안표준을 승인받아 RFC 1889와 RFC 1890으로 문서화됐다. 종단간 네트워크 전송 프로토콜인 RTP는 오디오, 비디오, 대화형 시뮬레이션 등 실시간 데이터를 멀티캐스트나 유니캐스트로 전송하기 적합한 기능을 제공해준다. RTP는 하위전송 프로토콜의 안전성과 순차적인 전송능력에 의존하기 때문에 패킷전송의 보증이나 정해진 시간 내에 확실하게 전송시키기 위한 메커니즘을 제공하는 것은 아니다.
그러므로 실시간 데이터 전송시 발생하는 패킷손실이나 지연, 비순차 패킷(Out-of-Order Packet) 등은 RTP의 시퀀스번호와 타임스탬프에 의해 재조립될 수 있다. RTP는 일반적으로 응용프로그램 수준에서 구현되며 UDP패킷으로 캡슐화해 UDP의 다중화 및 체크섬기능을 이용한다. RTP의 패이로드는 애플리케이션의 데이터형식을 나타내는 식별자다.
시퀀스번호는 RTP 데이터 패킷이 보내지는 순서를 나타내며 송신순서대로 증가되며 이것은 수신측에서 패킷손실을 검사하거나 재조립할 때 사용된다. 타임스탬프는 RTP 데이터 패킷의 샘플링 순간을 반영하는데 샘플링 순간은 비디오데이터와의 동기화나 지터계산을 위해 반드시 시간적으로 선형적인 클록부터 시작해야 한다. 이외에도 멀티캐스트 응용을 위한 SSRC, CSRC, CC필드 등이 정의돼 있다.
RTCP는 RTP 제어 프로토콜로 주로 멀티캐스트 환경에서 사용된다. 이는 세션 안의 모든 참가자(수신자)에게 제어패킷을 주기적으로 전송해 피드백되는 데이터로부터 서비스품질(QoS) 모니터링을 수행하고 수신자에 대한 정보를 제공할 뿐만 아니라 수신자 수로부터 전송률을 계산하는 기능도 갖고 있다.
인터넷을 통해 오디오나 비디오 등의 데이터를 실시간으로 전송할 때 나타나는 패킷손실에는 종단간 네트워크 지연, 지터, 비순차 패킷, 패킷손실 등이 있다. 종단간 네트워크 지연이나 지터는 네트워크 버퍼나 오디오 출력버퍼를 이용해 개선이 가능하며 패킷이 도착하는 순서가 뒤바뀌는 비순차 패킷도 패킷마다 가지고 있는 시퀀스번호를 재배열함으로써 대부분 복구할 수 있다.
에러 제어 메커니즘 필요 가장 심각한 패킷손실은 패킷 자체가 손실되는 것이다. 이는 인터넷이라는 공유망을 사용함으로써 불가피하게 발생하는 것이다. 트래픽이 심한 경우 40%까지 손실되는 것으로 나타나고 있다. 인터넷전화를 비롯, 영상회의시스템, 원격교육시스템 등 실시간 데이터 전송과 동시에 양방향성을 필요로 하는 인터넷서비스는 손실패킷을 제어 혹은 복구하는 기술이 핵심기술이다.
만약 패킷손실이 목적지의 수신자가 해독할 수 없을 정도로 크게 되면 에러제어 메커니즘이 필요하다. 대표적인 에러복구 메커니즘은 재전송을 기반으로 하는 ARQ(Automatic Repeat Request)와 손실된 원래의 데이터를 잉여정보로부터 복원하기 위해 원래의 정보에다 잉여정보를 전송해주는 것을 기반으로 하는 FEC(Forward Error Correction)다. ARQ 메커니즘은 종단간 지연이 매우 커 인터넷전화 등 실시간 서비스분야에 이용하기 어렵다.
반면 FEC는 실시간 전송이 반드시 요구되는 응용분야에 이용될 수 있다. 하지만 FEC의 패킷손실 복구능력은 네트워크 상 패킷손실 과정이 갖는 특성에 의존하게 된다. 이 때문에 손실된 패킷이 송신지에서 목적지까지 보내진 패킷스트림 전체에 퍼져 있을 때, 즉 패킷손실이 가능한 한 간헐적으로 발생할 경우 복구능력이 높지만 연속적으로 수개 이상의 패킷손실이 발생할 경우 복구에 어려움이 있다.
잉여정보(Redundancy)를 이용해 손실패킷을 복구하는 방법은 우선 오디오 정보를 두가지 이상 압축코딩방법으로 중복 코딩해 패이로드를 만들고 한 패킷에 서로 다른 시간대에 해당하는 패이로드를 하나의 패킷으로 묶어 전송하는 것이다.
일반적으로 높은 비트율의 고음질 압축방법(ADPCM, GSM)과 낮는 비트율의 저음질 압축방법(LPC)을 이용하게 되며 송신측은 트래픽 상태에 따라 동작모드를 선택할 수 있다. 수신측도 높은 음질의 패이로드를 우선적으로 디코딩하고 패킷손실이 발생할 경우 낮은 비트율의 패이로드를 디코딩해 오디오 스트림을 재생하는 방법을 사용한다.
인터넷전화를 전화 대 컴퓨터나 전화 대 전화모드에서 사용할 때 회선교환망(전화, PSTN)과 패킷교환망(컴퓨터, IP)을 연결시키는 게이트웨이는 전화가 컴퓨터 혹은 또다른 전화시스템과 호환성을 갖고 인터넷 상에서 동작할 수 있도록 해주는 기능을 수행한다. 게이트웨이들은 가상의 통합 네트워크를 만드는 데 이용되며 이를 통해 전화 사용자들이 PSTN을 이용하는 것처럼 인터넷망으로 통화할 수 있다.
현재 게이트웨이의 내부동작과 포트규모를 확장시키는 기능에 관한 표준화와 관련기술에 대한 연구가 인터넷 서비스 제공자(ISP)나 대규모 네트워크 사업자에 의해 활발하게 진행되고 있다. VoIP포럼에서는 제조사간 상호 호환성을 유지할 수 있도록 요구되는 기능과 프로토콜을 정의했다.
게이트웨이의 주요 기능을 보면 과금용 SW, 네트워크 관리SW 등을 제공하며 여러 가지 음성코딩방식을 수용할 수 있도록 설계돼 있다. 음성 암호화가 지원되는 것도 있고 수용회선이 수 회선부터 1백포트까지 이를 정도로 다양하며 이를 더욱 확장하기 위한 연구가 진행중이다.
kbps8.8kbps이하 통신기술 시급 우리나라의 경우 한국통신과 데이콤을 비롯 대우통신, 한솔텔레컴, 나우콤, 무역정보통신 등이 올해 말이나 98년 초부터 인터넷전화를 상용 서비스할 계획으로 준비를 서두르고 있다. 하지만 이들은 대부분 보컬텍이나 IDP 등의 외산 제품을 수입해 국산화가 시급한 상태다.
특히 국내 대학이나 연구소들이 연구하고 있는 영상 및 오디오회의시스템을 위한 프로토콜이나 시스템은 2010년까지 완료될 계획인 초고속 통신망이 설치돼야만 가능할 정도의 광대역용이어서 28.8kbps 이하에서 동작할 수 있는 실시간 통신기술 확보가 시급하다. 현재 목원대학교 MUSIC연구실이 개발중인 인터넷전화(Real Phone)시스템은 광대역 네트워크를 기반으로 하는 기존 연구들과 차별화한 것이라 할 수 있다. 리얼폰의 개발은 인터넷전화의 국산화에 기여함과 동시에 오디오나 영상회의같은 멀티미디어 시스템 개발에 핵심 요소기술로 그대로 이용될 수 있을 것으로 기대된다.
물론 RSVP 등 대역 예약 프로토콜을 이용하거나 인터넷전화를 위한 또다른 전용회선을 이용하는 방안도 검토되고 있지만 보다 대중적이고 가격경쟁력을 확보하기 위해서는 지금부터라도 기존 인터넷을 이용할 수 있는 고성능, 저대역폭, 고음질, 최소 전송지연을 갖춘 인터넷전화의 개발에 주력해야 할 것이다.
高大植
82년 경희대 전자공학과 졸업
87년 경희대 전자공학 석사
91년 경희대 전자공학 박사
95∼96년 미국 캘리포니아주립대(UCSB) 연구교수
90년∼현재 목원대 전자공학과 교수
한국음향학회 편집위원, 목원대 전산정보센터 소장