Kolik nás na internetu vlastně je?

Článek, pojednávající o tom, kolik uživatelů je na českém internetu a o informacích s tím souvisejících.

Počet IP adres zaznamenaných českými servery se pohybuje okolo 100 000, kolik je ale uživatelů a jak velká část z nich přistupuje pravidelně? Na jaké rozlišení optimalizovat web stránky?

Na tyto otázky dává odpověď unikátní projekt (viz. specifikace), který se uskutečnil v rámci BMI a byl zaměřen na stanovení počtu uživatelů českého Internetu a informací s tím souvisejících. Projekt připravila společnost Acron Commmunications ve spolupráci s týdeníkem Profit. Základem úspěchu byl okamžik, kdy se podařilo získat podporu nejnavštěvovanějších serverů českého Internetu. Projekt je založen na centrálním monitorování návštěvnosti hlavních stránek (HP - home page) vybraných serverů, čímž je umožněno aplikovat zvolenou metodiku na všechny servery. Systém umožňuje identifikovat jednotlivé instance prohlížečů (profily uživatelů) pomocí tzv. cookies. Systém nemá 100% identifikační účinnost, proto rozlišujeme tzv. identifikované a neidentifikované přístupy, což jsou přístupy při nichž byla respektive nebyla zaslána již dříve přidělená “visačka” (unikátní kód přidělený pomocí cookies).

Co je to český Internet a koho považovat za uživatele českého Internetu?
V našem výzkumu chápeme český Internet jako skupinu serverů, které jsou výhradně zaměřeny na českého uživatele Internetu, tj. servery publikující v češtině. Z této množiny serverů jsme vybrali reprezentativní vzorek, který byl tvořen 27 nejnavštěvovanějšími servery. Do této skupiny například nepatří www.mujweb.cz, který má sice vysokou návštěvnost, ale obsahuje mnoho stránek v angličtině včetně erotických, tudíž spektrum jeho návštěvníků nelze považovat za české.

Uživateli českého Internetu chápeme všechny návštěvníky českých serverů. Rozlišujeme tedy uživatele Internetu v České republice a uživatele českého Internetu. Rozdíl těchto dvou skupin tvoří například abonenti ISP, kteří mají aktivovánu pouze e-mail službu (tj. bez WWW přístupu).

Jedním z nedostatků prezentovaného průzkumu je nezapočítaní uživatelů, kteří nepoužívají grafiku, tj. nestahují obrázky umístěné na stránce. Bohužel neexistuje kvalifikovaný odhad počtu těchto uživatelů (příp. procentuální podíl), tudíž nelze provést aproximaci celkového počtu uživatelů.

Výsledné statistiky  

Celkový počet identifikovaných uživatelů:

478 475

Celkový počet přístupů:

8 928 555

    ... identifikovaných:

7 911 571

88,6%

    ... neidentifikovaných: 

1 016 984

11,4%

Aproximovaný počet uživatelů (odpovídá 100%):

539 980


Týdenní průměr počtu uživatelů:

197 896

Denní průměr (pracovní den):

73 687

Denní průměr (o víkendu):

24 780


Počet uživatelů přistupující každý týden:

58 638

 
Reprezentativnost analýzy dokládá skutečnost, že stejný výzkum byl proveden na redukovaném počtu 16 (z původních 27) nejnavštěvovanějších serverů. Výsledné hodnoty se lišily pouze o 0,82 procenta. Na druhou stranu, kdybychom nezařadili nejnavštěvovanější server seznam.cz, dostali bychom asi podstatně větší rozdíly:)

Jaký časový úsek je dostatečně dlouhý na určení celkového počtu uživatelů?
Nevím:( Jak je možné vidět na grafu, počet uživatelů s delším časovým obdobím stále rostl a nejevil známky konvergence, tj. nepřibližoval se k maximu, k celkovému počtu uživatelů.

 
 

IP vs. Uživatelé

Velmi zajímavé je srovnání uživatelů s příslušnými IP adresami. Vyskytují se dva případy:

1) uživatel přistupuje z více IP adres, např. dynamicky přidělované IP při dialup spojení, v tomto případě je počet skutečných návštěvníků menší než počet IP adres,

2) více uživatelů se prokazuje shodnou IP adresou, např. cache, firewall systémy, zkusme tedy například zjistit kolik uživatelů se “schovává” za jednotlivými IP adresami. Člověk znalý situace v českém Internetu by asi nezaváhal při tipování “největší” IP adresy. Jedná se o transparentní cache v síti TEN-34, která odděluje akademické sítě od komerčních. Cache se prokazuje více IP adresami, jak je vidět v následující tabulce 
 

IP    Počet "schovaných" uživatelů
c-engine4.ten34.ces.net

35 972

c-engine2.ten34.ces.net

19 490

c-engine1.ten34.ces.net

16 479

c-engine5.ten34.ces.net

6 038

Celkem

77 979

SERVERY
Výsledné statistiky jednotlivých serverů za první 4 týdny naleznete zde. Provozovatelé serverů mohou namítat, že statistika návštěvnosti jejich serveru neodpovídá běžně uznávaným údajům (např. DCCI). Ano, to je pravda. Míra odlišnosti se liší u konkrétních serverů a záleží na typu a topologii serveru. Vše je způsobeno skutečností, že náš průzkum se týkal pouze návštěvnosti hlavní stránky serveru. Pár příkladů na objasnění:

seznam.cz … je server, na který typicky uživatel přistupuje přes hlavní stránku, proto se počet uživatelů na HP příliš neliší od počtu uživatelů na celém serverů,

novinky.cz … velká část uživatelů přistupuje pouze na konkrétní články a to přímo z HP seznam.cz, kde se nacházejí příslušné odkazy; v tomto případě se počet uživatelů na HP a celém serveru liší výrazně,

mobil.cz, svet.namodro.cz, zive.cpress.cz … jsou servery, které obsahují tisíce nebo desetitisíce stránek – článků. Stránky jsou pravidelně indexovány známými prohledávači a umožňují tak mnoha uživatelům shlédnutí konkrétního článku – stránky (díky odkazu vygenerovanému na základě dotazu v prohledávači), proto se výrazně liší počty uživatelů na HP a celém serveru. V případě serveru mobil.cz máme jedinečnou možnost srovnat údaje o hlavní stránce (průzkum v rámci BMI) s údaji za celý server (data z monitor.cz). Oba přístupy jsou založeny na stejném principu a hodnoty jsou tedy porovnatelné (často se v různých článcích srovnávají hodnoty, které nebyly získány stejnou metodikou!). Počet uživatelů zaznamenaných na HP byl 35 719 a na celém serveru to činilo 54 659 uživatelů.

Na druhou stranu naše data byla "potvrzována" službou www.navrcholu.cz, která používá podobný princip monitorování návštěvnosti serverů. Například u serveru post.cz jsme sledovali hodnoty počet návštěv (sessions) a počet přístupů na HP, oba přístupy udávaly shodné hodnoty (odchylka byla okolo 1 až 2 %).

Technické informace - něco pro webmastery
Uživatele s MSIE 3.x (76 831 uživatelů) nám chtě - nechtě poskytli informace o nastavení jejich OS – konkrétně maximální počet barev a rozlišení monitoru. Mile nás potěšila velikost vzorku, ale je třeba mít na paměti, že uživatelé s prohlížečem MSIE 3.x nemusí být reprezentativním vzorkem HW vybavení uživatelů, tj. uživatel s nově zakoupeným PC si pravděpodobně nainstaluje nejnovější verzi WWW prohlížeče.

  Rozlišení monitoru   Maximální počet barev       

Závěr
Dovolím si říct, že projekt splnil naše očekávání a dal odpověď na mnoho otázek, na které dříve skoro neexistovaly odpovědi. Výsledné statistiky mohou pomoci k objektivnějšímu pohledu na český Internet, zvláště pak v poloze Internet = reklamní médium. Více dat a informací naleznete na stránkách

Jiří HolubecJiří Holubec