Mluvící obličeje na displejích mobilů? Již brzy!

„Šéfe, nepřijdu do práce!“ řekl lev na displeji mobilu. Takto mohou vypadat multimediální zprávy již v současnosti. Máme software, který ji vytvoří, máme telefony, které ji zobrazí, a dokonce máme sítě, které takovou zprávu přenesou. Nevěříte? V září začíná v Británii testovací provoz animovaných videozpráv, o Vánocích bude spuštěn komerčně.

Londýnská firma Anthropics našla způsob, jak učinit z SMSkování opravdovou multimediální zábavu. Vyvinula softwarové nástroje, díky nimž vám doručenou zprávu přečte určený interpret. Tímto „interpretem“ může být třeba křeček, mimino, karikatura amerického prezidenta nebo váš vlastní obličej. Zpráva je přečtena odpovídajícím tónem hlasu, obličej v 2D provedení velmi realisticky pohybuje rty a dělá grimasy. 

(kliknutím na kterýkoliv obrázek přejdete na demoverzi této aplikace)

Jaký má tento tzv. FaceWave messaging smysl? Uživatele telefonů s možnostmi MMS (Multimedia Messaging) nebudou komunikovat jinak než doposud - například odesílání prostého textu bude vždy oblíbené, protože je rychlé a diskrétní. Jde o jeho zpracování na straně příjemce. V systému FaceWave odesílatel zprávu napíše běžným způsobem - má podobu známé SMSky. Může ji také nahrát jako hlasovou zprávu. Poté přiřadí obličej interpreta (vybere samozřejmě takový, aby v kontextu zprávy působilo sdělení co nejkomičtěji) a odešle, o vše ostatní se postará systém. Jeho jádro tvoří klientský FaceWave server, zde jsou nahrány jednotlivé obličeje, uživatel však může také odeslat ke zpracování nový vzorek.  FaceWave server konvertuje text na hlas nebo zpracovává samostatný hlasový záznam, poté vytvoří obličejovou animaci, zprávu zkomprimuje a odešle příjemci. Ten musí mít telefon vybavený FacePlayerem (přehrávačem animací), který zprávu rozbalí a přehraje.

Zdálo by se, že taková aplikace musí být pro svou datovou náročnost určena až pro sítě 3. generace. Není tomu tak. Díky principu a stupni komprese by měl podle autorů přenos třicetisekundové animace trvat ve stavajících GSM sítích pouhých třicet vteřin. Jde pravděpodobně o případ, kdy je vzorek již přednahrán na klientském serveru. Přitom přenos stejně dlouhého videa (ve formátu MPEG4) trvá v GSM 40 minut, v 3G sítích by se doba přenosu měla pohybovat kolem 90 vteřin.

Jak dosáhl Anthropics tak úžasného stupně komprese? Matematický model pro výpočet pohybu rtů a pro grimasy vytvořili na základě sledování 120 bodů na obličeji a ramenou. Obličeje se liší jeden od druhého, ale jejich pohyby, jak říká jeden z tvůrců, jsou si podobné. Proto je možné tento model aplikovat na nejrůznější vzorky obličejů. Jistě jste si všimli, že tlamička onoho křečka se pohybuje spíš lidským způsobem... FacePlayer pracuje právě jen se souřadnicemi těchto bodů. Jak ovšem hrdě zdůrazňuje marketingový ředitel firmy: „Naše aplikace doručuje video, nikoliv animace...“ Ostatně výkonný ředitel Anthropicsu D. Kohler pracoval ve filmové společnosti DreamWorks a u Disneyho, dokonce obdržel Oscara za osobní vklad do rozvoje technologie počítačové animace.

Autoři aplikace tvrdí, že jejich produkt je univerzální. Tvoří ji několik součástí. FacePlayer komunikuje s okolím prostřednictvím API (Application Programming Interface, univerzální programové rozhraní), které užívá JavaScript. Díky němu mohou poskytovatelé přehrávač instalovaný v jakémkoliv prostředí ovládat a volit podle požadavků zákazníka obrazový i zvukový doprovod.

Samotný FacePlayer byl původně napsán v jazyce C++, další verzi vytvořili v Javě. Je tedy snadno použitelný na webu, jeho stažení i instalace by měly být snadné. Verzi pro mobilní telefony programátoři vytvořili v jazyce C, pracuje v prostředí operačních systémů Symbian, J2ME a Microsoft Smartphone 2002. Aby došlo k co největšímu rozšíření této zvláštní videoaplikace, bude přehrávač pro mobilní zařízení i internet šířen zdarma. Anthropics bude vydělávat na samotném MMS provozu, či - a to je pravděpodobnější - na prodeji softwaru pro MMS servery.

FaceServer Text umístěný na klientském serveru generuje z textu videoanimaci a syntetický hlas (T2V; text-to-video). Přístup do této aplikace je možný i prostřednictvím internetu, měla by být kompatibilní s existujícími aplikacemi. A samozřejmě je kompatibilní s uživatelským nástrojem pro tvorbu animací (FaceCreator). FaceServer Speech pracuje pouze s hlasovým vstupem, který analyzuje a přiřazuje mu animaci (S2V; speech-to-video). Těžko říci, zda si poradí s jinými jazyky než je angličtina. Profesionální nástroj pro tvorbu animací FaceDirector umí vytvářet lidské, animované i zvířecí interprety, metodou drag-and-drop (tahem myši) je možné přidávat nejrůznější výrazy obličeje.

Anthropics předvídá svému produktu velkou budoucnost. MMS zprávy v této podobě by měly překonat nedůvěru v možnosti budoucích 3G sítí, neboť tato aplikace se velmi podobá obsahu, který budou UMTS sítě schopny přenášet. FaceWave dále zvyší zájem o MMS ve stávajících sítích a také zvýší obrat operátorů. Textová zpráva v kontextu obrazu a zvuku by se mohla stát novým zdrojem příjmů. Aplikace je vhodná také pro mailové aplikace (doručování zpráv v obrazové podobě) - mohou ji použít například obchodníci pro rychlé a netradiční oslovení zákazníků. Zcela novou podobu by mohla získat uživatelská podpora (help desk) v softwarových produktech i na webu. Jaké možnosti otevírá FaceWave pro e-learning (učení prostřednictvím počítače), nemusíme komentovat.

Multimediální Faceplayer je v současnoti plně funkční v Nokii 7650 a sérii N 9200, testování aplikace integrované do těchto telefonů začne již v září. Ve spolupráci s výrobci se připravuje implementace do očekávaných  telefonů Sony Ericsson P800, Sendo Z100. Na konci roku 2002 bude zahájen komerční provoz, není zatím přesně známo, kteří operátoři se na něm budou podílet (zmíněn byl Vodafone a Telenor).

Uvidíme, zda se nový způsob textování chytne. Vše zřejmě bude záviset na ceně, je ovšem pravděpodobné, že pokud budete vlastnit telefon s možností odeslání MMS, neodpustíte si jednou za čas odeslat vtipný text doprovázený překvapivým interpretem. Zatím tato technologie pracuje pouze s připravenými či nově vypočítanými vzorky, očekává se však, že Anthropics již brzy nabídne software, který bude pracovat v reálném čase. Co to znamená? Například při předpovědi počasí si budete moci přepnout z Jána Zákopčaníka na Petru Volákovou...

Podívejte se na zajímavou reportáž BBC o společnosti Anthropics (56kbps, ISDN, kabel).