Lesk a bída knižních hodnocení. Co čísla na databázích skutečně znamenají
Když přečteme knihu, mnoho z nás si chce zapamatovat a zaznamenat, co v nás zanechala. Někteří se o tento svůj názor chtějí podělit i s ostatními čtenáři a třeba jim pomoci s výběrem nového příběhu. Právě proto jsou nesmírně důležité a zcela nezastupitelné weby, které umožňují knihy hodnotit a případně k nim psát recenze či komentáře.
Pojďme se tedy pobavit o tom, kolik lidí vlastně v České republice po přečtení knihy následně knihu ohodnotí na nějaké databázi. Jako vzor si můžeme a chci použít největší projekt tohoto typu, který v České republice existuje, a to Databázi knih. Naprosto legendární webovou stránku, která patří mezi jedny z nejnavštěvovanějších stránek v ČR a projekt, který velmi stojí na komunitě čtenářů a lidí, kteří knihy opravdu rádi doporučují. Není to ovšem jen Databáze knih, ale i řada dalších českých projektů, byť menších, a také zahraniční databáze, jako je asi nejznámější Goodreads, což je v podstatě taková světová obdoba Databáze knih.
Autoři a autorky v České republice Databázi knih vždy sledují, byť třeba říkají, že ne. Řeší, kolik mají procent, kdo napsal jaký komentář a jaké dal hodnocení. Je to tedy (nesmírně) důležitý ukazatel pro autory, nakladatele a samozřejmě i pro samotné čtenáře, kteří se na hodnocení knih dívají, když se rozhodují, zda si knihu koupí či půjčí. Neříkám, že všichni. Neříkám, jestli je to většina nebo menšina. To není důležité. Důležité je, že se jedná o významný parametr a o součást života knihy.
Pohled skrze reálná data
Proto jsem si pro vás připravil dva anonymizované příklady, které reprezentují to, co mám obecně vypozorované na konkrétních datech. Vybral jsem pro vás dvě knihy, abyste si mohli udělat představu, kolik lidí průměrně knihu ohodnotí poté, co ji má přečtenou, a to konkrétně na Databázi knih. Myslím si, že tyto závěry můžeme s určitou opatrností generalizovat i na celý trh.
První knihu, kterou jsem zvolil, z logických důvodů nebudu jmenovat. Ne proto, že by na ní bylo cokoliv špatně, ale proto, že já osobně mám pohled do interních dat prodejců v České republice, a tak mi v tomto musíte prostě trošičku věřit. Jedná se o literaturu faktu. Ne o beletrii. Chtěl jsem srovnávat minimálně dva typy literatury. Tato kniha je na trhu deset let, je velmi úspěšná a prodalo se jí více než 100.000 výtisků. Jenže já se tu nechci bavit pouze o prodaných kusech, ale o celkové čtenosti knihy.
K těmto sto tisícům tedy můžeme přičíst přibližně 20.000 e-knih, 5.000 prodaných audioknih a 10.000 výpůjček v českých knihovnách. Klidně mi můžete napsat do komentářů na jakékoliv sociální síti, jestli vám to přijde přehnané, ale přičetl bych k tomu ještě 15.000 knih prodaných na sekundárním trhu, tedy v antikvariátech, byť si osobně myslím, že to číslo může být klidně vyšší. A k tomu připočtěme dalších přibližně 35.000 přečtení, která můžeme připsat lidem, kteří si knihu půjčili v rodině nebo mezi přáteli, a také těm, kteří si ji pořídili nelegálně.
Když si tato čísla sečteme, dostaneme se zhruba na 185.000 přečtení. To už je opravdu velmi vysoké číslo, na které nedosáhne téměř žádná vydaná kniha.
A nyní se dostáváme k tomu podstatnému. Tato kniha má na Databázi knih více než 1.300 hodnocení. Na první pohled to může působit jako velké číslo a v rámci Databáze knih, to určitě lze označit za úspěch. Mnoho knih se nedostane ani nad 100 hodnocení. Když si ale spočítáme poměr hodnocení k celkovému počtu přečtení, dostaneme se zhruba na sedm desetin procenta. Jinými slovy, knihu ohodnotilo přibližně 0,7 procenta všech čtenářů, kteří se k ní za deset let nějakým způsobem dostali.
Než se pustíme do jakéhokoliv hodnocení, pojďme se podívat na druhou knihu. Tentokrát už se bavíme o beletrii. Kterou zná mnoho z vás, byť vám opět název neprozradím. V České republice se jí za pět let prodalo více než 50.000 výtisků a můžeme bez nadsázky mluvit o fenoménu. Kniha velmi dobře fungovala i v digitálních formátech. Prodalo se zhruba 10.000 e-knih a 5.000 audioknih.
K tomu přičtěme přibližně 15.000 výpůjček v knihovnách a dalších 20.000 přečtení, protože kniha byla v určitých obdobích a formách volně dostupná. Ať už legálně online, nebo formou sdílení, které autor i nakladatel tolerovali jako součást propagace titulu.
Když si tato čísla sečteme, dostaneme se zhruba na 100.000 přečtení. Krásné číslo, které potvrzuje, že se jedná o úspěšnou knihu s výrazným dosahem mezi čtenáři.
Podívejme se znovu na Databázi knih. V tuto chvíli má tato kniha přibližně 1.000 hodnocení. Což je samo o sobě pěkné číslo. Pokud si ale opět spočítáme poměr hodnocení vůči celkovému počtu přečtení, dostaneme se zhruba na jedno procento. Jinými slovy, i v tomto případě hodnotí knihu přibližně jeden ze sta čtenářů.
Jak tato hodnocení číst a hodnotit?
Dostáváme se k zásadní otázce. Jak moc jsou vlastně hodnocení knih na databázích, aplikacích a e-shopech relevantní, když je vytváří jen velmi malá část čtenářů. Jak jsme si ukázali na konkrétních datech výše, v reálném světě se bavíme zhruba o jednom procentu lidí, kteří knihu nejen přečtou, ale zároveň ji jdou aktivně ohodnotit. A to ještě za předpokladu, že daný čtenář hodnotí pouze na jednom místě, což je ve většině případů realita.
Poznámka autora: Všechna uvedená data zde musíte brát s rezervou. Ale i kdyby knihy po přečtení ohodnotilo pět procent všech čtenářů, stále se bavíme o výrazné menšině.
Většina čtenářů si neudělá účet na pěti různých databázích a e-shopech, aby tam zanechala totožné hodnocení. Pokud už nějakou platformu používají, zpravidla se drží jediné. To samo o sobě znamená, že každá databáze nebo aplikace pracuje s výrazně specifickým a vyprofilovaným vzorkem čtenářů. A právě tady začíná vznikat problém, který je z pohledu interpretace dat naprosto zásadní.
Existuje řada odborných studií, které ukazují, že lidé se na různých platformách chovají odlišně a že samotná povaha webu výrazně ovlivňuje to, jakým způsobem knihy hodnotí. Velmi dobře to popisuje odborný článek publikovaný v časopise Online Information Review, který detailně analyzuje rozdíly mezi hodnoceními knih na e-commerce webech a komunitně orientovaných sociálních databázích.
Závěr této studie je poměrně jednoznačný. Hodnocení knih se napříč platformami liší nejen v absolutních číslech, ale především v tom, na co se čtenáři při hodnocení zaměřují. Na e-shopech lidé častěji řeší vnější aspekty knihy. Naproti tomu komunitní databáze a sociální sítě zaměřené na knihy kladou mnohem větší důraz na samotný obsah, styl psaní, autora a interpretaci textu. Jinými slovy, nejde jen o rozdílná hodnocení, ale o zcela odlišné úhly pohledu na tutéž knihu.
To má jeden velmi důležitý důsledek. Hodnocení z jediné platformy nikdy nereprezentuje univerzální čtenářský názor, byť by vzorek mohl být statisticky relevantní. Vždy je hodnocení zatížené tím, kdo danou platformu používá a jaký typ čtenáře se na ní přirozeně koncentruje. A čím více je databáze postavená na komunitním principu, tím silnější tendence k vytváření názorových bublin zde vzniká.
Komunitní weby mají jednu společnou vlastnost. Přitahují především nadšené a angažované čtenáře. Lidi, kteří čtou hodně, dlouhodobě a kteří mají ke knihám silný vztah. Právě tito čtenáři mají také výrazně vyšší motivaci knihu ohodnotit. Masový čtenář, který si koupí jednu nebo dvě knihy ročně, knihu dočte a jde dál, se do hodnocení zapojuje jen výjimečně.
Dokonalé knihy? Přeci erotika
Typickým příkladem jsou erotické a romantické knihy, které na databázích často dosahují extrémně vysokých hodnocení, mnohdy přesahujících osmdesát i devadesát procent. Neznamená to nutně, že by tyto knihy byly univerzálně milované napříč celou populací či tak výborně napsané. Znamená to, že je čte velmi jasně vymezená skupina čtenářek, která cíleně vyhledává konkrétní žánr, ví, co od něj očekává, a hodnotí ho výrazně pozitivně právě proto, že dostává přesně to, co hledá. Bublina je zde velmi silná, ale zároveň zcela přirozená.
Na opačném konci spektra stojí velké bestsellery. Knihy, které se dostanou mimo svou původní cílovou skupinu a začnou je číst lidé s velmi rozdílnými očekáváními, zkušenostmi i čtenářským vkusem. Právě v tomto okamžiku se bublina rozpadá. Hodnocení, které bylo v rámci úzké skupiny vysoké, začne klesat. Ne proto, že by se kniha zhoršila, ale proto, že ji začínají hodnotit lidé, pro které už daný typ vyprávění, styl nebo téma není samozřejmý.
Z pohledu literární vědy i sociologie je tento jev dlouhodobě popsaný. Hovoří se o efektu selektivního publika a o tzv. sampling bias, tedy zkreslení vzorku. Čím širší publikum kniha osloví, tím pestřejší spektrum názorů se v hodnoceních objeví a tím více se výsledek blíží reálnému průměru. Paradoxně tedy platí, že klesající hodnocení u masového bestselleru může být známkou jeho skutečného společenského dosahu, nikoliv selhání.
Je to vlastně trochu paradox. Zatímco debutová kniha s několika desítkami hodnocení, často od nadšených čtenářů nebo lidí z blízkého okruhu autora, může velmi snadno dosahovat devadesáti pěti procent, titul, který se stane skutečným bestsellerem a nasbírá statisíce hodnocení, se téměř nevyhnutelně začne propadat někam k průměru. Ne proto, že by byl horší, ale proto, že zasáhl výrazně širší a názorově pestřejší publikum, včetně čtenářů, kterým se prostě netrefil do vkusu. Tady bych mohl odkázat na svůj článek o bestselleru Znamenitá mrtvola. To je totiž zcela ukázkový příklad.
Z těchto důvodů je potřeba s hodnoceními pracovat velmi opatrně. Neodmítat je, ale ani je nepřeceňovat. Jsou důležitým signálem, nikoliv absolutní pravdou. A bez pochopení toho, kdo hodnotí, kde hodnotí a proč hodnotí, se z čísel velmi snadno stane zavádějící zkratka.
Lesk a bída databází
Jasně jsme si ukázali, a všichni to vidíme, že hodnocení knih jsou velmi důležitá. Jsou ukazatelem pro čtenáře, minimálně nějakým parametrem pro knihkupce, nakladatele i samotné autory, byť mohou být v mnoha ohledech nepřesná, přestože stále vycházejí z relativně velkého vzorku dat. Byl bych strašně rád, kdyby provozovatelé jakýchkoliv databází, e‑shopů či aplikací tuto realitu vnímali, a to i včetně jejích negativních aspektů.
Nejen v České republice, ale celosvětově se umělecká díla, jako jsou knihy, filmy či hudební alba, stávají předmětem soupeření různých skupin, nebo prostě jen nástrojem vyřizování osobních účtů. Masová společnost totiž hodnocení tohoto typu vnímá jako něco velmi důležitého. Navíc vyrůstáme ve společnosti, kde jsme od mládí hodnoceni poměrně pochybným systémem známkování, a sami jsme si zvykli svět škálovat. Od jedné do pěti. Od nuly do sta. Je to způsob, jak si realitu zjednodušit, a je to zcela pochopitelné.
Fenomén takzvaného review bombingu, nebo obecně malicherného vyřizování účtů skrze nízká hodnocení a tvrdé komentáře, je ale strašně smutný. Osobně je mi vždy líto každého autora, na kterého to dopadne, a je v zásadě jedno, co stálo na úplném počátku. Právě proto je skvělé, když databáze dělají maximum pro to, aby to nebylo tak jednoduché.
Osobně si myslím, že existuje celá řada vhodných kontrolních mechanismů, a nyní je vztáhnu čistě na svět knih. Zakládání nových účtů by mělo být složitější než jen zadání e‑mailu a jeho potvrzení. Naprosto ideální je ověření přes telefon. Databáze knih tento mechanismus v minulosti měla a já jsem tomu kroku tleskal. Dnes jsem zjistil, že tento kontrolní prvek už není aktivní, a upřímně mě to mrzí. Je to velká škoda, protože právě na Databázi knih často vidíme různá soupeření skrze nulová hodnocení na jedné straně a obranu pomocí pěti hvězd na straně druhé. Je to nekonečný příběh.
Kontrolní mechanismy ale nemusí končit jen u ověřování identity. Jedním z velmi funkčních nástrojů může být například povinnost přidat textový komentář v případě nejnižšího hodnocení. Pokud jsem přesvědčen, že je kniha opravdu špatná, měl bych být schopen o tom napsat alespoň pár vět. Dalším krokem může být započítávání hodnocení do celkového skóre pouze u aktivních uživatelů. Tedy u těch, kteří mají účet založený alespoň dva týdny, na databázi nebo e‑shop přišli vícekrát, ohodnotili určité množství knih, vyplnili dotazník, nebo si alespoň propojili účet s existující sociální sítí... To by byl z mého pohledu velmi zdravý kompromis mezi otevřeností a ochranou systému.
Některé z těchto ochranných parametrů jsme ostatně zavedli i do aplikace KDčko, a právě zkušenost z praxe mi potvrzuje, že to dává smysl. Ne proto, abychom někoho omezovali, ale proto, abychom zvýšili relevanci dat, se kterými následně všichni pracujeme.
Na závěr chci poděkovat všem z vás, kteří knihy hodnotíte a píšete recenze. Je to skvělá a pro knižní svět nesmírně důležitá věc. Zároveň ale nevytvářím žádný tlak na ty z vás, kteří to nedělají. Je to vaše svobodné rozhodnutí a je naprosto v pořádku. Chápu, že na to někdo nemá čas, nebo to nepovažuje za důležité. Mnozí z vás navíc otevřeně říkají, že se podle databází vůbec neorientují a spoléhají se na vlastní vkus, doporučení blízkých nebo náhodu. I to je naprosto legitimní přístup. A možná právě díky této různorodosti má svět knih stále smysl.
Autor tohoto článku je spisovatel, pracuje ve vedení nakladatelství a knihkupectví. Přednáší též o knižním světě, businessu a založil komunitu Knižní závisláci. Všechny názory uvedené v tomto textu jsou zcela soukromé a nereprezentují oficiální pozici žádné společnosti či oborové organizace. Máte-li jakoukoliv otázku či v článku najdete chybu, prosím napište na e-mail adam.pycha@gmail.com.