Počet IP adres zaznamenaných českými servery se pohybuje okolo 100 000, kolik je ale uživatelů a jak velká část z nich přistupuje pravidelně? Na jaké rozlišení optimalizovat web stránky?
Na tyto otázky dává odpověď unikátní projekt (viz. specifikace), který se uskutečnil v rámci BMI a byl zaměřen na stanovení počtu uživatelů českého Internetu a informací s tím souvisejících. Projekt připravila společnost Acron Commmunications ve spolupráci s týdeníkem Profit. Základem úspěchu byl okamžik, kdy se podařilo získat podporu nejnavštěvovanějších serverů českého Internetu. Projekt je založen na centrálním monitorování návštěvnosti hlavních stránek (HP - home page) vybraných serverů, čímž je umožněno aplikovat zvolenou metodiku na všechny servery. Systém umožňuje identifikovat jednotlivé instance prohlížečů (profily uživatelů) pomocí tzv. cookies. Systém nemá 100% identifikační účinnost, proto rozlišujeme tzv. identifikované a neidentifikované přístupy, což jsou přístupy při nichž byla respektive nebyla zaslána již dříve přidělená “visačka” (unikátní kód přidělený pomocí cookies).
Co je to český Internet a koho považovat za uživatele českého Internetu?
V našem výzkumu chápeme český Internet jako skupinu serverů, které jsou výhradně
zaměřeny na českého uživatele Internetu, tj. servery publikující v češtině. Z
této množiny serverů jsme vybrali reprezentativní vzorek, který byl tvořen 27
nejnavštěvovanějšími servery. Do této skupiny například nepatří www.mujweb.cz,
který má sice vysokou návštěvnost, ale obsahuje mnoho stránek v angličtině
včetně erotických, tudíž spektrum jeho návštěvníků nelze považovat za české.
Uživateli českého Internetu chápeme všechny návštěvníky českých serverů. Rozlišujeme tedy uživatele Internetu v České republice a uživatele českého Internetu. Rozdíl těchto dvou skupin tvoří například abonenti ISP, kteří mají aktivovánu pouze e-mail službu (tj. bez WWW přístupu).
Jedním z nedostatků prezentovaného průzkumu je nezapočítaní uživatelů, kteří nepoužívají grafiku, tj. nestahují obrázky umístěné na stránce. Bohužel neexistuje kvalifikovaný odhad počtu těchto uživatelů (příp. procentuální podíl), tudíž nelze provést aproximaci celkového počtu uživatelů.
Výsledné statistiky
Celkový počet identifikovaných uživatelů: | 478 475 |
|
Celkový počet přístupů: | 8 928 555 |
|
... identifikovaných: | 7 911 571 |
88,6% |
... neidentifikovaných: | 1 016 984 |
11,4% |
Aproximovaný počet uživatelů (odpovídá 100%): | 539 980 |
|
Týdenní průměr počtu uživatelů: | 197 896 |
|
Denní průměr (pracovní den): | 73 687 |
|
Denní průměr (o víkendu): | 24 780 |
|
Počet uživatelů přistupující každý týden: | 58 638 |
Reprezentativnost analýzy dokládá skutečnost, že stejný výzkum byl proveden na
redukovaném počtu 16 (z původních 27) nejnavštěvovanějších serverů. Výsledné
hodnoty se lišily pouze o 0,82 procenta. Na druhou stranu, kdybychom nezařadili
nejnavštěvovanější server seznam.cz, dostali bychom asi podstatně větší
rozdíly:)
Jaký časový úsek je dostatečně dlouhý na určení celkového počtu
uživatelů?
Nevím:( Jak je možné vidět na grafu, počet uživatelů s delším časovým obdobím
stále rostl a nejevil známky konvergence, tj. nepřibližoval se k maximu, k celkovému
počtu uživatelů.
IP vs. Uživatelé
Velmi zajímavé je srovnání uživatelů s příslušnými IP adresami. Vyskytují se dva případy:
1) uživatel přistupuje z více IP adres, např. dynamicky přidělované IP při dialup spojení, v tomto případě je počet skutečných návštěvníků menší než počet IP adres,
2) více uživatelů se prokazuje shodnou IP adresou, např. cache, firewall systémy,
zkusme tedy například zjistit kolik uživatelů se “schovává” za jednotlivými IP
adresami. Člověk znalý situace v českém Internetu by asi nezaváhal při tipování
“největší” IP adresy. Jedná se o transparentní cache v síti TEN-34, která
odděluje akademické sítě od komerčních. Cache se prokazuje více IP adresami, jak je
vidět v následující tabulce
IP | Počet "schovaných" uživatelů | |
c-engine4.ten34.ces.net | 35 972 |
|
c-engine2.ten34.ces.net | 19 490 |
|
c-engine1.ten34.ces.net | 16 479 |
|
c-engine5.ten34.ces.net | 6 038 |
|
Celkem | 77 979 |
SERVERY
Výsledné statistiky jednotlivých serverů za první 4 týdny naleznete zde. Provozovatelé serverů mohou namítat,
že statistika návštěvnosti jejich serveru neodpovídá běžně uznávaným údajům
(např. DCCI). Ano, to je pravda. Míra odlišnosti se
liší u konkrétních serverů a záleží na typu a topologii serveru. Vše je
způsobeno skutečností, že náš průzkum se týkal pouze návštěvnosti
hlavní stránky serveru. Pár příkladů na objasnění:
seznam.cz … je server, na který typicky uživatel přistupuje přes hlavní stránku, proto se počet uživatelů na HP příliš neliší od počtu uživatelů na celém serverů,
novinky.cz … velká část uživatelů přistupuje pouze na konkrétní články a to přímo z HP seznam.cz, kde se nacházejí příslušné odkazy; v tomto případě se počet uživatelů na HP a celém serveru liší výrazně,
mobil.cz, svet.namodro.cz, zive.cpress.cz … jsou servery, které obsahují tisíce nebo desetitisíce stránek – článků. Stránky jsou pravidelně indexovány známými prohledávači a umožňují tak mnoha uživatelům shlédnutí konkrétního článku – stránky (díky odkazu vygenerovanému na základě dotazu v prohledávači), proto se výrazně liší počty uživatelů na HP a celém serveru. V případě serveru mobil.cz máme jedinečnou možnost srovnat údaje o hlavní stránce (průzkum v rámci BMI) s údaji za celý server (data z monitor.cz). Oba přístupy jsou založeny na stejném principu a hodnoty jsou tedy porovnatelné (často se v různých článcích srovnávají hodnoty, které nebyly získány stejnou metodikou!). Počet uživatelů zaznamenaných na HP byl 35 719 a na celém serveru to činilo 54 659 uživatelů.
Na druhou stranu naše data byla "potvrzována" službou www.navrcholu.cz, která používá podobný princip monitorování návštěvnosti serverů. Například u serveru post.cz jsme sledovali hodnoty počet návštěv (sessions) a počet přístupů na HP, oba přístupy udávaly shodné hodnoty (odchylka byla okolo 1 až 2 %).
Technické informace - něco pro webmastery
Uživatele s MSIE 3.x (76 831 uživatelů) nám chtě - nechtě poskytli informace o
nastavení jejich OS – konkrétně maximální počet barev a rozlišení monitoru. Mile
nás potěšila velikost vzorku, ale je třeba mít na paměti, že uživatelé s
prohlížečem MSIE 3.x nemusí být reprezentativním vzorkem HW vybavení uživatelů,
tj. uživatel s nově zakoupeným PC si pravděpodobně nainstaluje nejnovější verzi
WWW prohlížeče.
Rozlišení monitoru Maximální počet barev
Závěr
Dovolím si říct, že projekt splnil naše očekávání a dal odpověď na mnoho
otázek, na které dříve skoro neexistovaly odpovědi. Výsledné statistiky mohou
pomoci k objektivnějšímu pohledu na český Internet, zvláště pak v poloze Internet
= reklamní médium. Více dat a informací naleznete na stránkách