/TOMÁŠ FÜRST/
Už před virem se mě chopila myšlenka, která se dnes stává ještě aktuálnější a sem ji píšu jako reakci na diskusi pod příspěvkem Karla Hrona na UP Reflexi. V kontextu etických problémů (nejen) na RCPTM chci přemýšlet o rozumném vzdělávání přírodovědců v oblasti práce s daty. Jak říkají Američané, „never let a good crisis go to waste“.
Vycházím z přesvědčení, že data jsou ropou 21. století a datová analytika změní svět tak, jak jej změnil spalovací motor. Naše fakulta si podle mne už nemůže dovolit produkovat absolventy, kteří neumějí pracovat s daty. Přes patnáct let se potuluji po různých koutech UP a jejího okolí, prošel jsem UMTM, CRH, část úvazku mám překvapivě stále na RCPTM, spolupracoval jsem s matematiky, informatiky, fyziky, biology, chemiky, geology a geografy, lékaři a zubaři, umělci, sociology, psychology, jazykovědci, inženýry, ekonomy i teology. Většina potíží, na které jsem u toho narážel, se týkala práce s daty, nepochopení principu statistiky či jejího nesmyslného užívání a různých nedorozumění o tom, co je to výzkum a jaký je jeho smysl. Mnohokrát jsem se setkal se „scientific misconduct“, v drtivé většině případů to bylo z neznalosti a naivity, nikoliv ze zlé vůle. Nepříjemně často jsem byl svědkem toho, že nic netušící, zcela nedostatečně vzdělaní a příliš submisivní studenti byli v oblasti práce s daty svými vedoucími tlačeni do scestné až škodlivé činnosti.
Proto bych rád navrhl, aby všichni studenti Přírodovědecké fakulty (a časem snad i celé UP) měli v prvním ročníku jeden kurs, který bude zahrnovat:
- filosofii přírodních věd (co je věda a co není, co je experiment, co je falsifikace, co je model, co je predikce, co je nejistota, …)
- etiku vědecké práce (co je data falsification a data fabrication, plagiarismus a co dělat, když se s tím potkám nebo když mě k tomu někdo nutí)
- elementy práce s daty (jak se data sbírají a vizualizují, na co si dát pozor, jak číst tabulky a grafy, co je smyslem statistiky, co je nejistota, co jsou časté chyby v interpretaci, …)
- slovníček matematiky (že matika je jazykem přírodních věd, z čeho sestává a kde se to lze naučit)
- softwarovou gramotnost (jaké existují softwary, k čemu jsou dobré a kde se je naučit)
- čtení a psaní (jak vypadá odborný text, jak se čte a jak se píše, příklady a protipříklady)
- trochu historie vědy a výzkumu (aby bylo jasno, že je málo důležitějších věcí v dějinách naší civilizace a že je důležité to dělat pořádně!)
- elementární logiku a úsudek (co je implikace a co ekvivalence, jaké jsou trable s procenty, časté chyby v úvahách, cognitive bias v myšlení, ….)
- něco o nejistotě (aspoň co je pravděpodobnost, co je podmíněná pravděpodobnost a že p(A|B) není to samé co p(B|A))
Nesmí to být zase další frontální přednáška. Je dost skvělých materiálů na webu, není třeba to převyprávět v aule, česky a špatně. Představuji si, že ke každému výše uvedenému tématu natočíme krátkou (třeba 10–20 minut) video-motivaci. Tu by mohl namluvit někdo známý/zajímavý/důležitý v kontextu UP. Dále bude ke každému tématu existovat jedna nebo dvě stránky s osnovou a odkazy, co si kde přečíst a co pochopit. Každé téma bude končit obecným úkolem (například vyhledat a odprezentovat pseudo-vědecký argument, nastudovat nějakou scientific misconduct kauzu, představit nějaký software a jeho možnosti, či dokonce zopakovat nějaký experiment či výpočet), který bude konkretizován vyučujícím. Předmět by se učil tak, že ti, kdo si ho zapíší (optimálně všichni), dostanou přiděleného teaching asistenta (ideálně z řad doktorandů daného oboru) a s tím se několikrát za semestr sejdou, rozdají si úkoly, popovídají si o zadaných online materiálech a navzájem si odprezentují a zoponují rozdané individuální úkoly. Každý student si vybere oblast, která ho zaujala, dostane jeden úkol a odprezentuje výsledek před svojí skupinou. Může být ještě nějaký testík, aby se frekventanti nevykašlali na vše ostatní, krom oblasti svého úkolu.
Když si přípravu těch 10 oblastí rozhodíme (ke každé oblasti je na fakultě dost lidí, které to baví a zajímá), tak to můžeme mít do měsíce nachystané. Současné koronavirové běsnění nám dodalo dvě další motivace k výše uvedenému:
- Konečně jsme objevili kouzlo online výuky a nepřeberné množství vynikajících online zdrojů.
- Posledních pár týdnů se veřejná debata na celém světě vede o testech, sensitivitě, specificitě, procentech promořenosti, modelech šíření epidemií, koeficientu R0 v diferenciální rovnici (!), … prostě není lepší doba na vysvětlování, že práce s daty je fakt důležitá.
Proto se vyhněme předvánočnímu shonu a zaveďme tento předmět hned. Může se jmenovat SciONline.