Gateway pro IP telefonii - kódování hovoru

Článek rozebírá technické detaily a faktory uvlivňující přenos hlasu po IP síti a popisuje způsoby kódování hovoru.

Gateway pro IP telefonii je klíčovou částí služeb IP telefonie, neboť umožňuje spojení mezi telefonní a packetovou sítí.  Typická gateway nabízí následujících pět funkcí:
 

1. Komunikace s PBX, PSTN a nebo jiným telefonním spojením
2. Základní  zpracování hovoru = sestavení/rozpojení
3. Hlasová komprese a dekomprese v reálném čase
4. Packetování a depacketování komprimovaného hlasu
5. Komunikace s IP sítí

Gateway může poskytovat i jiné funkce, jako Interactive Voice Response (IVR), účtovací software a tak podobně, ale uvedené funkce jsou nutné pro každou aplikaci.

Při zavádění gateway pro IP telefonii je třeba se soustředit na několik věcí:

  • kvalita hlasu
  • standard
  • laditelnost.

Kvalita hlasu

realizovaná IP telefoníí je často diskutovaný, ale nepochopený předmět.  Typické jsou generalizace typu: "Není to přijatelné na veřejném internetu, ale dobré na Intranetu".   Důvodem těchto tvrzení je, že je velmi nesnadné mluvit objektivně o něčem ve spojení s internetem, tím spíš o něčem natolik subjektivním jako je kvalita konverzace přenášené po internetu.

V reálném světě se kvalita hlasu IP telefonie může velmi lišit a záviset na milionech důvodů.  Gateway, telefonní systémy, software,  kvalita spojení, ISP, denní doba, to vše a nejen to má vliv na hovor.  Kvalita hlasu může být rozdělena na tři na sobě závislé části:

  • srozumitelnost
  • echo
  • zpoždění

Srozumitelnost

je  ovlivněna hlavně výběrem vocoderu (voice coder), převaděčem analogového hlasového signálu do signálu digitálního, který je pak zpětně převáděn zase do řeči.
 

Hlavní vocodery na dnešním trhu jsou:

  • G.711: The G.711 algorytmus koduje nekomprimovaný tok řeči při rychlosti  64 Kbps.  Kvalita je na úrovni PSTN a vyžaduje plnou pásmovou šířku tradičních spínaných obvodů.
  • ITU G.723.1: běhá na  6.4 nebo  5.3 Kbps a používá lineární kódování a slovníky pro vyhlazení.  Vyhlazovací proces zatěžuje CPU (30 MIPS na Intel Pentium) což znamená, že laditelné řešení potřebuje výraznou počítačovou kapacitu.
  • ITU G.729A: Chodí na  8 Kbps s 35 ms systémového zpoždění.  Kvalita se velmi blíží placenému hovoru a mnoho let je používán jako řečový dekodér pro Frame Relay.  G.729A je primární dekodér pro IP telefonii používaný IMTC-VoIP.
  • Voxware MetaVoice RT 24:  MetaVoice RT 24 algorytmus je 2.4 Kbps, pracující v reálném čase pro apilkaci mající minimální požadavky na  procesing a kvalitu řeči.  MetaVoice je navržen tak, aby ignoroval šum, přenášel čistý zvuk a snižoval objem dat analyzovaných kompresí.
  • Voxware SC6: běhá na 6.4 Kbps
  • Elemedia SX7300P:  Elemedia SX7300P - vysoká kvalita při  7.3 Kbps. Dovoluje přenášet hlasovou komunikaci přes  V.34 nebo V.32bis modemy.
  • MS-GSM: Tento algoritmus z Microsoftu, 13 Kbps je derivátem ITU (International Telecommunications Union) GSM
    standardu.  

Šířka pásma pro vocoder

Přenos nezkomprimované řeči zabírá podstatnou část vlnového pásma sítě.  Proto jsou používány vocodery pro kompresi před a dekompresi po přenosu.  Malé zpoždění je způsobeno jednak tím nabíráním dat a jednak  "posunutím vpřed" při kompresi mezi 15-45 ms.  Součet obou zpoždění se zhusta nazývá algoritmickým zpožděním.

Voceder způsobuje ještě jedno zpoždění při provádění komprese řeči pro přenos.  To je prováděno procesorem počítače, například Sun Solaris UltraSPARC nebo Lucent DSP.  Čím je procesor rychlejší, tím je zpoždění menší.  Tento čas se pak nazývá kompresní zpoždění.
 

Hlasová kvalita: Řízení kompresního zpoždění je funkcí architektury gateway.  Kromě toho protože vocodery pouze opisují analogovou vlnu mluvené řeči, ztráta kvality je při zpětné dekompresi nevyhnutelná. Kvalita nejpopulárnějších vocoderu byla měřena mnoha skupinami, většinou používajícími Mean Opinion Score (MOS).

Na stupnici MOS se nula rovná nejhorší kvalitě a 5 té nejlepší.  Následující tabulka uvádí MOS, rychlost a velikost vzorku  pro několik vocoderů.
 

Vocoder Bit rate Kbps MOS
G.711 64 4.4
G.723 16.3 3.6
G.723.1 15.4 3.4
G.729a 8 4.0
Voxware RT24 2.4 2.9
Voxware SC6 6.4 3.7
Elemedia SX7300 7.3 3.5
MS-GSM 13 3.1

Algorimy běhající v nižší rychlosti potřebují delší dobu pro rozkódování.  Obecně znamená nižší přenosová rychlost větší možné zpoždění.

Relevantní odkazy

  • Úvod do IP telefonie - základní údaje a potenciální zákazníci - 1. díl seriálu
  • Rozdíly mezi klasickou a packetově spínanou telefonní sítí - 2. díl seriálu
  • Rubrika IP telefonie

    autor Matthew McCoin