/JIŘÍ KVITA/
Motto: Cimrmanova metoda slepých uliček aneb
Fitováním exponenciály na datech pochybného významu a provenience žádné hlubší pochopení podstaty epidemie nevzniká, natož pak způsob, jak jí čelit.
S trochou dobře míněné nekorektnosti je možno říci, že informatik je člověk, který vám vyřeší problém, o kterém jste nevěděli, způsobem, kterému nerozumíte, a který by bez něj ani neexistoval.
Meteorolog je člověk, který vám v pondělí řekne, jak bylo v neděli, a politolog člověk, který vám řekne, co psali včera v novinách. Když máte jednu ruku ve sněhu a druhou v horkém čaji, tak vám statistik řekne, že jste na tom v průměru dobře. A podobně tomu, kdo se snaží na současných „datech“ předpovědět nějaký vývoj situace s epidemií COVID-19, a „vidí“ na „datech“ nějaký „zlom k dobrému jako v Korei“, je dobré připomenout, že takovýto soud není o moc cennější než věštba z křišťálové koule. Zatím je možná tak jasné, že jsme předehnali Japonsko. Bohužel jen v počtu známých pozitivních případů.
Podle dalšího známého nekorektního výroku je filozofie přesným zacházením s nepřesnými pojmy – a obdobně je tomu s mnoha současnými pokusy o předpověď vývoje ze současných znalostí.
Schází nám totiž mnoho důležitých podrobností: jak vybírají vzorky k testům jednotlivé země, zda se testují plošně všichni, či jen hospitalizovaní nemocní s horečkami, testují se všichni snad i opakovaně, testují se všechny případy i s mírnými příznaky, jak široké okolí podezřelého pacienta se testuje? Atd.
Počet případů sice roste exponenciálně, ale exponenciální fity nám mohou posloužit jen ke dvěma účelům. Jsou to tyto tři:
i) Širší edukace o tom, co jest lineární a logaritmické měřítko na ose y. To samo o sobě nikdy neuškodí, neboť člověk přemýšlí a automaticky plánuje (extrapoluje) spíše lineárně, ale tohle je bohužel něco jiného. Jak si mnozí z nás všimli, nepřibývá každý den přibližně stejný počet případů, nýbrž spíše nějaký násobek počtu z předchozího dne. A počet případů tak velmi rychle roste. Samozřejmě se děje i to, že růst se s časem trochu mění, ale zda se skutečně zastavuje, či jen přicházejí zpožděná data, docházejí testy či se naopak začíná plošněji testovat, je většinou jasné až zpětně.
ii) fitujeme zjevně data, která jsou silně vychýlená a nesrovnatelná, jak v čase, tak v prostoru – v poslední době už jen tím, že laboratoře přestávají stíhat testovat a že se mění metoda výběru vzorků. Takže se může zdát, že se růst třeba zastavuje , ale ve skutečnosti to může být naopak.
iii) Fitování exponenciál může bohužel velice jednoduše vést ke strašení veřejnosti či ústavních činitelů, nebo naopak k přehnaně optimistickým závěrům, pokud výsledky nejsou komentovány profesionály z oboru, i když i u nich se názory liší [5-6]. Fitovat exponenciálu je snadné, ale už méně je jasné, co z fitu vyvodit. Nejlépe ne o mnoho více, než kolik případů asi bude ohlášeno druhý den (pokud se ovšem významně nezmění počet provedených testů). O skutečném množství nemocných a o tom, zda jejich počet převyšuje oficiálně známá čísla faktorem 10 či 100, nám to mnoho neřekne.
It‘not a theory, it‘s a scenario. It‘s not a scenario, it‘s a model. It‘s not a model, it‘s just a fit.
iv) Je vidět, že jde o materializaci nějakého lidského (snad až jeskynního) instinktu aplikovat známé a dostupné nástroje i na neznámá nebezpečí. Ale pozor: co když je z medvědí rodinky ve vchodu do jeskyně vidět jen hlava medvíděte, nebo co když kolega z tlupy aplikuje dle svých zkušeností obranu proti medvědovi hnědému, zatímco do jeskyně se dere koala, grizzly nebo medvěd lední? Bitva se pak může ubírat zcela jinak než dle jeho lineárního očekávání.
Já sám jsem si také prošel svým exponenciálním stádiem, poslední výstřelek je k nahlédnutí zde http://jointlab.upol.cz/kvita/virus/covid-19/ConfirmedCases_latest.png. Je ale otázkou, co z toho někomu rozumně vzkázat krom toho, že snad umím vykreslit graf a proložit jím exponenciálu – a ještě špatně, neb chyby v jednotlivých dnech jsou silně korelované, jde totiž o kumulativní četnosti. Kdokoli z mé fakulty to ostatně zvládne také.
Druhou možností je, že si člověk v domácí karanténě může (pokud není příkladným dobrovolníkem), ve volném čase za dlouhých jarních večerů programovat „počítačové hry“ a hrát si s numerickými modely, jak se nákaza může šířit populací http://jointlab.upol.cz/kvita/simulations.html [lze si souběžně pustit první dvě videa]. Takovéto naivní modely by šlo jistě dále rozvíjet (a budu rád za zájemce z řad SŠ studentů:), ale mají jen málo společného s realitou – zatím ukazují jen tak „překvapivé“ závěry, jako například že karanténa pomůže tím, že odsune a sníží peak počtu nemocných a tedy zatížení nemocnic. Ale o ekonomických a společenských dopadech opatření či o možném zhroucení efektivity zahlceného zdravotnického systému nám toho příliš neřeknou.
Co z toho všeho plyne? Zůstaňme doma, pokud můžeme, to je naše hlavní společenská zodpovědnost a možnost, jak z pohovky zmírnit šíření této nové epidemie. A můžeme pak v usebrání rozjímat o svých blízkých, o současnosti, o plánech a o světě, a o možném poučení, které, až pomine nejhorší, snad nalezneme.
Spousta šikovných doma šije roušky, chemici a firmy míchají desinfekce, tisknou štíty, dobrovolníci vše rozvážejí potřebným. Sestry, lékaři a medici se připravují na hrozící nápor, horečně shánějí a třídí informace, postupy a pomůcky, často na úkor zdraví svého či své rodiny slouží dnem i nocí – či jsou v nucené karanténě bez svých blízkých. Nezapomínejme na ně. Ti všichni si každou osmou hodinu večerní zaslouží náš potlesk z balkonu. A my ostatní můžeme přispět těm, kteří mají nápady, jak opravdu pomoci, a umějí je realizovat třeba takto:
https://www.prf.upol.cz/nc/zprava/clanek/chemici-z-up-vyrabeji-stovky-litru-dezinfekce/
Hodně štěstí a sil všem přeje nejen autor.
Odkazy:
[1] Globální mapa: https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6
[2] Tomas Pueyo I: https://medium.com/@tomaspueyo/coronavirus-act-today-or-people-will-die-f4d3d9cd99ca
[3] Tomas Pueyo II https://medium.com/@tomaspueyo/coronavirus-the-hammer-and-the-dance-be9337092b56
[4] česky zde: https://medium.com/@krivka.adam
[5] Polemika: J.O.A. Ioannidis: https://www.statnews.com/2020/03/17/a-fiasco-in-the-making-as-the-coronavirus-pandemic-takes-hold-we-are-making-decisions-without-reliable-data/
[6] Odpověď: Harry Crane: http://jointlab.upol.cz/kvita/virus/275-m-Statnews-1.pdf
[7] Epidemiologická kalkulačka: https://epidemie.abradatas.cz/
A trocha zdravé kritiky a humoru:
[Noah Haber] Armchair Epidemiology: https://medium.com/@noahhaber/flatten-the-curve-of-armchair-epidemiology-9aa8cf92d652
[M. Schott] https://non-trivial-solution.blogspot.com/2020/03/what-physicists-can-say-about.html
[T. Dorigo] https://www.science20.com/tommaso_dorigo/the_virus_that_turns_physicists_into_crackpots-246490
[R. Broderick] https://www.buzzfeednews.com/article/ryanhatesthis/im-not-an-epidemiologist-but-the-rise-of-the-coronaR
[J. Monk] https://twoev.wordpress.com/2020/03/19/modelling-the-invisible-part-of-the-cross-section/
PS: autor v žádném případě nechce umenšovat ale ani přeceňovat význam strojového učení a jeho aplikace na předpovídání mnoha jevů od burzy po řízení automobilů:)