Pod pokličkou PDA: Tajemství písma

Na počítači se obvykle zadává text z klávesnice. PDA jej umí rozpoznat napsaný rukou pomocí speciální tužky - stylu. Jak tento systém funguje a jaké cesty k němu vedly? V tomto článku se vám pokusíme odpovědět.

Prvním počítačem, který bychom dnes označili za PDA byl, pokud odmyslíme fázi Science Fiction, systém Apple Newton, zvaný prostě Newton. Sám název PDA ostatně pochází od bývalého CEO společnosti Apple Johna Sculleyho. Newton se vyráběl v různých provedeních mezi lety 1993 – 1998 a přesto, že nikdy nedosáhnul drtivého úspěchu, je možné jej považovat za první zařízení svého druhu na světě. Vývojové experimenty s ním jsou ovšem ještě starší a jdou před rok 1990.

V té době se mimo jiné řešil problém, jak do nové koncepce počítače – inteligentní „kreslící tabulky“ - zadávat text. Princip přenosných zařízení byl na konci osmdesátých let dvacátého století již znám a technologie mobilní klávesnice byla dostatečně zvládnuta, nicméně toto vstupní zařízení se pro nový produkt nehodilo. Jednak by totiž hyzdila jeho plochý design, ale především by představovala nevítanou mechanickou součást tam, kde měl jedinou komunikaci mezi uživatelem a jeho přístrojem zprostředkovávat na dotek citlivý displej. Ten byl, a dodnes je, představován síti vstupních bodů, které se fyzicky překrývají s výstupními; tedy s pixely displeje. Aktivace vstupního bodu, tedy dotek pera na některém místě se prakticky rovná klepnutí počítačové myši v daných souřadnicích. Díky tomu je pro PDA jednoduché naprogramovat uživatelské rozhraní a aplikace. Tento mechanismus ale řeší stisknutí tlačítka, nebo volbu ovládacího prvku z okna, poklepání na ikonu, nikoliv zadávání písma. A protože klávesnice by se k novému zařízení nehodila, nastala otázka, jek ho donutit „číst“ lidské znaky.

Rozpoznávání na druhou

Systém počítačového rozpoznávání písma také není ničím novým. OCR, neboli Optical Charakter Recognition se datuje víceméně od padesátých let minulého století. V podobě, v níž je používán posledních asi dvacet let jde vesměs o přídavnou funkci počítačových scannerů užívaných k převodu papírových dokumentů do elektronické podoby. Systém je schopen porovnávat dígitalizovaný obraz se známou maticí znaků. V případě, že najde dostatečnou shodu mezi části obrazu a některým ze znaků, které umí rozeznat, prohlásí danou část za znak, zapamatuje si ji a vyloučí z dalšího rozpoznávání. Díky tomu je možné do počítače „přečíst“ obsah neskenovaného dokumentu. Přesnost čtení je tím vyšší, čím přesněji a výrazněji jsou znaky na originálním dokumentu vytištěny. Tomuto systému zjišťování textu z digitalizované předlohy se říká offline rozpoznávání.

Tajemství písma

Zápis textu na PDA má ale jinou podobu. Text není žádným připraveným dokumentem. Navíc, uživatel jej zadává na stále stejnou plochu. Proto se používá online rozpoznávání. Jeho základní princip, tedy porovnávání zadaného textu se známou matricí znaků je podobný, jako v případě OCR, samotná technologie je ale odlišná. Znaky, které uživatel do PDA zadává jsou v podstatě systémem křivek. Každá má svůj výchozí bod a vlastní podobu. Rozpoznávací software porovnává nikoliv křivku z optického obrazu, ale tu, která vzniká sekvencí aktivovaných citlivých bodů v digitizeru kapesního počítače. V případě, že se zadaná křivka dostatečně podobá obsaženému vzoru, je znak vyhodnocen jako úspěšně rozpoznaný, předán softwaru a zapomenut, protože na stejné místo se musí zadat další. Toto jsou obecné principy rozpoznávání písma, nicméně jejich praktické aplikace se v mnohém liší.

Ploška nebo klávesnice

Technicky nejsnazší metodou zadávání písma do počítače ovládaného pomocí na dotek citlivého displeje je virtuální klávesnice. V různých formách ji používají takřka všechna PDA, najdeme ji také u dalších perem ovládaných zařízení jako jsou tablety a podobně. Klávesnice je programově nenáročná, nevyžaduje po softwaru žádnou inteligenci a po uživateli nutnost se přizpůsobovat. Podobně je to i s přesností rozpoznávání doteku ovládacího pera. Nicméně již první PDA, tedy Newton obsahoval funkci pro rozpoznávání písma založenou na principech, které byly popsány výše. Práce s virtuální klávesnicí je totiž relativně pomalá a, slovy společnosti Apple, málo elegantní.  

Tajemství písma

Písmo a počítač 

Nicméně rozpoznávání písma tak, jak bylo realizováno v Newtonu uživatelé nepřijali. Hlavním nedostatkem byla nedostatečná přesnost, Newton rozpoznával psané písmo špatně, přestože měl mít schopnost se adaptovat na styl psaní svého majitele. Jako hlavní problém byla identifikována skutečnost, že tento systém zadávání znaků pracoval se skutečným lidským písmem, které je příliš individuální a složité na interpretaci. V důsledku těchto poznatků byl vyvinut systém Graffiti užívaný původně na počítačích Palm, nicméně v různých podobách adaptovaný i do jiných zařízení. Na rozdíl od původního systému z Newtonu není Graffiti založeno na reálném písmu, nýbrž na jedno zjednodušené podobě. Uživatel se musí naučit sérii znaků – tahů perem, které představují zástupce písmen a jsou jim podobné. Znaky jsou vytvořeny tak, aby byly pro člověka jednoduché na zapamatování si a zápis, a pro počítač na rozpoznání. Díky jejich jednoduchosti a unifikaci se také PDA nemusí na nic adaptovat – to je ponecháno na člověku.  Za optimálních podmínek je tak možné dosáhnout rovnováhy mezi potřebou uživatele a techniky, nicméně právě odlišnost od skutečného písma je hlavním kamenem úrazu. Ne každý člověk mající PDA je totiž ochoten, nebo schopen se „nové písmo“ naučit.

Tajemství písma

Rozpoznávání psaného písma, které najdeme v počítačích s operačním prostředím od Microsoftu je ve své podstatě fúzí několika předešlých technologií. Graffiti je zde k dispozici v podobě „blokového rozeznávání“, nicméně těžiště zadávání textu leží ve schopnosti přístroje poznat psaný text. Pokud se písmena zadávají do plošek, které jsou určené pro malá/velká/čísla a obsahují vodící linku, velmi se zjednodušuje jejich rozeznávání, PDA totiž podle umístění pera ví, jaký typ znaku byl zadán. Kromě toho je možné systém rozpoznávání pomocí jeho nastavení přizpůsobovat uživateli. V případě, že úspěšnost rozpoznávání není dostatečná, může uživatel přepnout na  spolehlivější Graffiti, nebo virtuální klávesnici.

Budoucnost

Ani nejdokonalejší rozpoznávání psaného písma počítačem se nehodí pro zadávání delších textů. To je smutná pravda, která se ukázala nejen na PDA, ale také na počítačích typu Tablet PC, a to na několika jejich generacích za sebou. Pokud chcete PDA k takovým textům využít, nasaďte si raději skládací klávesnici, nebo použijte běžný stolní počítač. Nicméně rozpoznávání písma je velmi šikovný a praktický nástroj, nesrovnatelně rychlejší a elegantnější, než klávesnice a v případě, že jej ovládnete také velice praktický. Vděčíme za něj snaze mnoha vývojářů, a také velkému počtu omylů, slepých cestiček a dokonce i soudních sporů. Tato technologie, která se nachází „pod pokličkou“ PDA představuje jeden z jejich základních kamenů.