/JAROMÍR ŠIŠKA/
Žijeme v zajímavé době. Máme datové vědce, z výuky se chystáme vynechat Newtonovy zákony, aby bylo více prostoru pro informatiku. A sbíráme různá data, aniž bychom dobře věděli, co znamenají, mnohdy děláme závěry z dat nehomogenních, z dat bez kontextu, anebo se rozhodování na základě dat naopak bráníme a upřednostňujeme emoce.
Změnila se definice epidemie, změnila se definice nemocného – k označení stačí výsledek testu, přestože pořádně nevíme, co ten výsledek říká. Symptomy, základní nástroj medicíny až do roku 2019, jejich přítomnost anebo nepřítomnost, dnes k označení někoho za nemocného nepotřebujeme. Přečetl jsem si příspěvky doktora Fürsta i prof. Hořejšího a zejména druhý zmiňovaný ve mně vyvolal řadu otázek. V závěru svého článku (bod 4.) prof. Hořejší odmítá sběr dat a vytváření lepších modelů, aby pak v následujícím odstavci doporučoval masivní povinné testování s důslednou karanténou infikovaných. Ale: co je testování jiného než sběr dat? Takže nějaká data bychom podle Hořejšího přece jenom sbírat měli a také se podle nich řídit.
Pokud tedy sbíráme data – testujeme – měli bychom si říct, co námi nashromážděná data znamenají a jak je interpretovat. V převážné většině se v ČR v souvislosti s Covidem používají dva typy testů – PCR a antigenní. Každý test má dva důležité parametry – senzitivitu a specificitu, neboli údaje o tom, jaké procento testů vykazuje falešnou negativitu a falešnou pozitivitu. Znát tyto dva údaje je pro správnou interpretaci výsledků testování klíčové. U PCR testu je situace o to komplikovanější, že PCR používá amplifikační techniku a počet cyklů této amplifikace ovlivňuje jak senzitivitu tak specificitu. PCR testuje na přítomnost fragmentů viru ve zkoumaném vzorku, a nikoliv na přítomnost celého živého (tudíž potenciálně nebezpečného) viru. Takže kromě toho, že nutnými předpoklady pro správnou interpretaci testů jsou znalost senzitivity, specificity, a to v závislosti na počtu amplifikačních cyklů, je nutné též vědět, kolik amplifikačních cyklů se ke každému konkrétnímu výsledku použilo. Respektive obráceně – měla by být stanovena jednotná metodologie, která počet amplifikačních cyklů jednoznačně stanovuje tak, aby sbíraná data byla homogenní a specificita a senzitivita byla v rozumných mezích. Tyto intervaly by měly být známé, abychom získaná data mohli smysluplně interpretovat.
Je zcela zjevné, že procento falešně positivních i falešně negativních výsledků je přímo závislé na počtu amplifikačních cyklů. Zvýšíme-li počet cyklů, snížíme počet falešně negativních výsledků a na druhou stranu zvýšíme počet falešně positivních výsledků. Příliš vysoký počet amplifikačních cyklů tudíž vede k nízké specificitě. Na toto nebezpečí opakovaně upozorňuje odborná literatura, upozorňuje na ně vynálezce tohoto způsobu testování Kary Mullis, upozorňuje na to ve svých materiálech WHO (https://www.who.int/news/item/20-01-2021-who-information-notice-for-ivd-users-2020-05). O tom, jak přesně tyto závislosti fungují, nepanuje shoda a pokud vím, neexistuje žádný ucelený přehled. Uváděná čísla se hodně liší, nicméně lze asi říct, že specificita je v rozumných mezích, pokud je počet amplifikačních cyklů (Ct) 25–30. Při hodnotách Ct nad 30 začínají procenta falešné pozitivity narůstat rychleji, a to exponenciálním růstem. Je vcelku překvapivé, že vzhledem k tomu, o jak důležitý parametr se jedná , neexistuje zde snadno dostupná a obecně uznávaná studie této závislosti.
Podívejme se, jaký vliv mají různé hladiny falešné pozitivity na interpretaci čísel pozitivně testovaných na virus, která se každý den dovídáme. Průměr pozitivních z celkového počtu provedených testů od počátku listopadu do konce února je téměř 30%, počítejme tedy se 30% positivních výsledků. Průměrný počet testů za den byl přibližně 25 000, použijme tedy toto číslo i následující úvaze. Průměrný počet pozitivně testovaných nám tudíž pro naše výpočty vychází 7 500. Zkusme tři následující scénáře:
- specificita (SP) testu je 95%
- specificita testu je 85%
- specificita testu je 75%
Protože jde pouze o ilustrativní příklad a nechci čtenáře zatěžovat delšími výpočty, budu předpokládat, že sensitivita testů je 100%. Pokud by někoho zajímalo, jak velký vliv má tento předpoklad na získaná čísla, je na konci článku Dodatek, ve kterém jsou uvedeny tabulky některých zde uvedených veličin spočítané pro různé hodnoty specificity a sensitivity.
Co chceme najít je počet skutečně pozitivních (true positive, TP) a podívat se kolika procenty jsou TP zastoupeny v ve všech pozitivních. Označme k = (100 – SP)/100 a najděme počet skutečně pozitivních (TP). Ten spočteme z rovnice
(25 000 – TP)k + TP = 7 500
Konkrétně pro naše tři scénáře:
ad a) Je-li k = 0.05, je počet opravdu pozitivních (TP) roven 6 579, tudíž přibližně 88% z celkového počtu pozitivních.
ad b) Je-li k = 0.15, je počet opravdu pozitivních (TP) 4 412, tudíž přibližně 59% z celkového počtu pozitivních.
ad c) Je-li k = 0.25, je počet opravdu pozitivních (TP) 1 667, tudíž přibližně 22% z celkového počtu pozitivních.
Provedeme-li velmi hrubou extrapolaci z našich výpočtů založených na průměrných datech z posledních čtyř měsíců na přibližně 1.2 mil. pozitivně testovaných za uplynulých 12 měsíců, dostaneme dle jednotlivých scénářů čísla (zaokrouhlená) – 1.05 mil, 0.7 mil, 0.27 mil. Vidíme, že s poklesem specificity testu počet skutečně positivních skutečně rychle klesá.
Z těchto příkladů je vidět, jak důležité je znát specificitu testů. Pokud jsou informace o závislosti specificity na počtu amplifikačních cyklů alespoň přibližně správné, byl by vliv laboratoří, které prováděly amplifikačních cyklů 35 nebo více, na počty TP a FP značný. Poměrně přesný odhad specificity by nemělo být obtížné získat – nicméně jsem toto číslo pro testovaní v ČR nikdy z oficiálních zdrojů neslyšel. A ani se po něm nikdo nijak zvlášť neshání – opozici, novináře, nejrůznější experty, kteří se k vývoji infekce vyjadřují, základní parametry užívaných testů očividně vůbec nezajímají. To už středoškolskou matematiku zcela zapomněli anebo věří, že testy jsou tak dokonalé, že toto je podružná informace?
Předchozí odstavce rozhodně nejsou pokusem o vytvoření nějakého relevantního modelu pro Covid v ČR. Na to jsou tyto úvahy příliš hrubé. Chci zdůraznit, že o žádné z výše uvedených specificit netvrdím, že toto je obecná specificita PCR testů. Já věřím, že lze za určitých předpokladů provést PCR test s vysokou specificitou. Toto ale není hlavní problém. Problém je, že testované osoby nemají o parametrech testu na nich prováděných žádné konkrétní údaje. Dosavadní praxe byla taková, že test nebyl pouze nějaká metody poskytující kvalitativní anebo kvantitativní odpovědi, nýbrž metoda včetně návodu, jak odpověď interpretovat. Metoda bez interpretace nebyla dosud nikdy považována za smysluplný test.
Opakuji, že účelem je ukázat, že i po roce žití s Covidem a akceptování ekonomických důsledků nouzových stavů víme o zdravotní situaci v ČR zoufale málo. Pozitivně testovaní se zaměňují za nemocné. Obsazenost nemocnic Covidovými pacienty dále zvyšujeme změnou úhradové vyhlášky. Již v roce 2020, úhradová vyhláška výrazně finančně motivovala nemocnice, aby jako primární důvod pobytu pacienta uváděly infekci koronavirem, přestože pacient vyhledal ošetření kvůli zcela jinému problému, nicméně po přijetí byl positivně otestován na koronavirus.. Od ledna 2021 byla vyhláškou úhrada dále navýšena. Stále počítáme nějaké R, které by mělo zachycovat, jak se virus v populaci šíří. Nepočítáme ho ale z počtu nakažených, ale z počtu pozitivně testovaných, aniž bychom s rozumnou přesností věděli, jaký je mezi těmito veličinami vztah.
Václav Hořejší říká, že moc nerozumí statistikům. Já moc nerozumím Václavu Hořejšímu. V dnešní situaci jsme se neocitli přes noc. Na získávání dat, kladení otázek a hledání odpovědí jsem měli 12 měsíců. Dvanáct měsíců se zde aplikují tvrdá protiepidemická opatření, o nichž nevíme, jak podstatný je jejich epidemiologický vliv, ale víme poměrně přesně, co nás bezprostředně stojí a víme, že budou mít další dramatické důsledky – zanedbaná další závažná onemocnění, dopad na vzdělání dětí a mladou generaci celkově, dopady na staré lidi, atd. Václavu Hořejšímu opravdu moc nerozumím. Máme rozumět jeho příspěvku tak, že podporuje politická rozhodnutí s dramatickými dopady, která jsou založena převážně na dojmech, pocitech a přáních? Hlavně aby byla prováděna energicky a bez zbytečných otázek? Trochu mně to připomíná člověka, který moc neví kde je, ani pořádně neví, kam chce jít, ale to hlavní je jít rychle. Václav Hořejší uvádí, že Covid prokazatelně prodělalo 10% populace a velmi pravděpodobně dalších 20%. Bylo by prosím možné k těmto číslům uvést nějaké zdroje?! Tato čísla nejsou totiž důležitá jenom pro posouzení, jak blízko či daleko jsme od signifikantního promoření celé populace a potencionální stádní imunity, ale mají významný vliv i na interpretaci vlivu falešně positivních testů.
Věda je o kladení otázek a hledání odpovědí na ně na základě cíleného shromažďování poznatků. Pro efektivní zvládnutí tohoto viru si nutně musíme klást otázky a hledat na ně odpovědi. Vytvářet hypotézy, sbírat data a zjišťovat, zda-li jsou získaná data s našimi předpoklady a hypotézami ve shodě, anebo je naopak vyvracejí. Co když je nakažlivost nemoci nižší, než předpokládáme v našich opatřeních, ale smrtnost Covidu je vyšší? Umíme tuhle hypotézu spolehlivě vyloučit? Je povaha viru taková, že ho můžeme porazit (v podstatě vymýtit) anebo se s ním musíme naučit žít? Každá otázka a odpověď implikuje jinou strategii, jiné kroky a postupy, které je vhodné zvolit. Pokud nechceme nebo nemůžeme hledat nové cesty, pokud nebudeme mít pochybnosti nebo budou pochybnosti potlačovány, pokud nebudeme hovořit o míře naší ignorance, začneme stagnovat. Nebudeme mít nové nápady, nebudeme hledat a ověřovat nová pozorování, protože už víme, co je pravda a co je správně. Svoboda pochybovat je klíčová součást nejen vědy, ale celé evropské civilizace. Svoboda pochybovat, nevědět, nebýt si jistý nebyla a není samozřejmost – je výsledkem dlouhého boje v evropské historii a kultuře.
Dodatek
Zde uvádíme dvě tabulky. První ukazuje, jak by vypadaly průměrné počty skutečně infikovaných v závislosti na konkrétních údajích o specificitě a sensitivitě testů.
spec = 0.95 | spec = 0.85 | spec = 0.75 | |
sens = 0.75 | 6696 | 4688 | 1875 |
sens = 0.85 | 6641 | 4554 | 1771 |
sens = 0.95 | 6597 | 4453 | 1696 |
sens = 1.00 | 6659 | 4412 | 1667 |
Tabulka 1. Skutečné počty infikovaných v závislosti na sensitivitě a specificitě použitého testu. Předpokládáme 25 tisíc testů denně, z nichž 30 procent (tedy 7.5 tisíce) vyjde positivně. Čísla v tabulce ukazují, kolik je mezi 25 tisíci otestovanými asi skutečně infikovaných.
Druhá tabulka uvádí, jak se tyto denní průměry skutečně infikovaných promítnou do interpretace uváděného čísla 1.2 milionu pozitivně testovaných. Jinými slovy, kolik z tohoto počtu bylo skutečně infikovaných Vzhledem k tomu, že obecně platí, že čím je vyšší sensitivita, tím je nižší specificita a obráceně, je sensitivita uváděna vzestupně a specificita naopak sestupně. Připomeňme, že nevíme jak konkrétně závisí sensitivita na specifitě v případě českého PCR testování.
spec = 0.95 | spec = 0.85 | spec = 0.75 | |
sens = 0.75 | 1.071 | 0.750 | 0.300 |
sens = 0.85 | 1.063 | 0.729 | 0.283 |
sens = 0.95 | 1.056 | 0.713 | 0.271 |
sens = 1.00 | 1.053 | 0.706 | 0.267 |
Tabulka 2. Odhadované počty (v milionech) skutečně infikovaných při 1.2 milionech positivně otestovaných od začátku epidemie v ČR v závislosti na sensitivitě a specificitě použitého testu.