A KORONAVÍRUS TERJEDÉSÉT ELŐREJELZŐ MATEMATIKAI-STATISZTIKAI MODELLEK TANULSÁGAI

dusek.jpgA koronavírus-járvány matematikai modellekkel történő előrejelzésének ismeretelméleti kérdéseit tárgyalja a cikk. Az adatok megfigyelési nehézségei, a járvány terjedését befolyásoló valószínűségek hiányos ismerete és időbeli változása nem teszik lehetővé a járvány lefolyásának pontos matematikai előrejelzését. Hálózatkutatók állíthatják, hogy képesek előrejelezni a járvány alakulását, ezt a könnyen ellenőrizhető állítást a tapasztalat rendre cáfolta. Az egyes modellek a terjedésre befolyást gyakorló tényezők szerepét tudják bemutatni, és ezzel iránymutatást, segítséget adnak mind a döntéshozóknak a közösségi intézkedések meghozatalához, mind az egyéneknek a kockázatot csökkentő viselkedéshez.

Kulcsszavak: koronavírus-járvány, előrejelzés, matematikai modellek, valószínűségszámítás alkalmazása

Üzleti SZEmle - 2021. március

A koronavírus megjelenésének elején, 2020 márciusában villámgyorsan kerültek be a köznyelvi használatba egyes járványügyi szakkifejezések, mint a járványgörbe, a reprodukciós ráta, a nyájimmunitás, a pandémia, jóval később a vírusmutáció. A híradások arról szóltak, hogy a személyes kapcsolatok lehetőségét korlátozó intézkedések célja a járványgörbe kilapítása, ellaposítása, a reprodukciós ráta egy alá szorítása. Járványügyi szakértők latolgatták annak esélyét, hogy a vírus terjedésére milyen hatást gyakorol a trópusi időjárás, a páratartalom, a hőmérséklet, a maszkok és azok típusai, a karantén és annak hossza, az iskolák bezárása, mekkora a regisztrált és a látens fertőzöttek aránya, melyik tesztelési eljárás mennyire megbízható, mekkora az esélye a tünetmentes vírushordozásnak és fertőzőképességnek. Számos olyan kérdés vetődött fel az általános híradásokban, amely korábban jellemzően elkerülte a nem szakemberek radarkészülékét.

Emellett a híradásokban elhangzó elemzéseknél komolyabb modellek is megjelentek a tudománynépszerűsítő irodalomban, amelyek gyakran a jövőre vonatkozóan adtak előrejelzést a járvány alakulásáról. Ilyen előrejelzés látható például az Institute of Health Metrics and Evaluation (Egészségmérési és Értékelési Intézet) honlapján: https://covid19.healthdata.org/

Ezeknek az előrejelzéseknek az ismeretelméleti problémáit szeretném tárgyalni, amelyek két nagy csoportra bonthatók:

  1. Matematikai modellek használata ismeretlen vagy hiányosan megismerhető tapasztalati adatok esetén.
  2. Valószínűségi modellek megadása egyedi lefolyású eseményre vonatkozóan, ahol a tapasztalati valószínűségek nem vagy nem pontosan ismertek és változók.

A matematikai modellek nagy sikerrel és hatékonysággal alkalmazhatók az élettelen természet jelenségeinek előrejelzésére. Ennek a sikernek az az előfeltétele, hogy a jelenségek közötti kapcsolatokat leíró függvények ismertek és változatlanok legyenek, a bennük szereplő változók és állandók megfigyelhetők és mérhetők. Ahol erre mikroszkopikus szinten nincs lehetőség, ott a rendszerek makroszintjét a valószínűségszámításnak és a matematikai statisztikának köszönhetően még mindig le lehet írni, amely egyben a mikroesemények ismert valószínűségét (relatív gyakoriságát, ami ebben az esetben egyenlő a valószínűséggel) is jelenti.

Ehhez képest teljesen mások a biológiai rendszerek (élő természet, ökológiai rendszerek) és a társadalommal kapcsolatos rendszerek. Egyrészt a rendszerek működésére befolyást gyakorló változók száma sokkal nagyobb a fizikai rendszerekéhez képest. Elég csak azokra a sokszínű kockázati tényezőkre gondolni, amiket egy klinikai vizsgálat vagy gyógyszerhasználat során említeni szoktak. Ezek között vannak genetikai, környezeti, viselkedési jellegű változók, mindegyik kategóriában számos lehetséges befolyásoló faktorral. Másrészt ezen változók megfigyelése, operacionalizálása lényegesen bonyolultabb az élettelen természet összetevőinél. Harmadrészt a mikroesemények valószínűsége nehezen meghatározható, megfigyelhető és időben is változó (a koronavírus kapcsán a legfontosabb mikroesemény a vírus átadása és a betegség lefolyása). Negyedrészt a változók közötti kapcsolatok ki vannak téve az időbeli változásnak, azokat a pontos megfigyelésük és mérésük mellett is állandóan, időtől, helytől, kontextustól függően kell mindig újra és újrakalibrálni ahhoz, hogy egzakt matematikai előrejelzést adjunk a rendszer működéséről. Ha megelégszünk a minőségi előrejelzésekkel, akkor utóbbira nincs szükség. A minőségi előrejelzések olyan jellegűek, amelyek, egyéb tényezőket figyelmen kívül hagyva, megmondják a két jellemző közötti kapcsolat irányát, de a konkrét függvény formáját és számszerű értékeit nem határozzák meg a mérhetőség nehézségei miatt. Például az egy minőségi előrejelzés, hogy ha valaki dohányzik, nagyobb eséllyel kap torokrákot ahhoz képest, mintha nem dohányozna, és hiányérzetünk lehet azért, mert nem tudjuk ezt a valószínűséget számszerűen egyetlen pontos értékkel kifejezni.

Mindezt alkalmazva a koronavírus-járvány jövőbeli lefolyását előrejelző modellekre, az azokban résztvevő nagyszámú változó egy része nem ismerhető meg sem jelenidejűleg, sem retrospektíven, utólag. A matematikai előrejelzés nagyjából annyit tud tenni, mint a minőségi előrejelzés: a rendszer működésére befolyást gyakorló változók alakulása hogyan befolyásolja a járvány lefutását, növeli, csökkenti, azok nagyságrendjét megbecsülheti. A járvány kitörésekor korábbi járványokra vonatkozó megfigyeléseket használtak fel és olyan adatokat, hogy a kezdeti gócpontnak számító Vuhanban és zsúfolt helyeken (tengerjáró hajókon) mekkora volt a relatív esetszám. Ezek esetleges számok, esetleges paramétereket és járványlefutási előrejelzést eredményeztek, amely előrejelzéseket már pár héttel később is cáfolta az élet, függetlenül attól, hogy milyen módszert vetettek be a kutatók: differenciálegyenleteket, neurális hálókat, Kálmán-szűrőt, kernel függvényeket, fraktálokat, logisztikus regressziót, döntési fát. Ugyanez volt a sorsuk a későbbi előrejelzéseknek is. Bármennyire is állították a hálózatkutatók, hogy képesek előrejelezni a járvány lefolyását, ezt a könnyen ellenőrizhető állítást a tapasztalat rendre cáfolta. A bizonytalanság növekszik, ahogyan az előrejelzést időben és térben egyre finomítjuk, vagyis növeljük az időtávot és növeljük a térbeli felbontást, és csökken, ahogyan egyre több adat gyűlik össze a járvány lefolyásáról. Az adatok mennyiségének és minőségének növelése segíti az előrejelzést, amin az általános intézkedések és az egészségügyi felkészülés alapul, de mindez nem költségmentes. Ez hasonló az időjárás-előrejelzésekhez, amelyek megbízhatósága az elmúlt évtizedekben növekedett a növekvő adatvagyon és számítási kapacitás miatt, és amelyek annál megbízhatóbbak, minél rövidebb időtávra és nagyobb térségre vonatkoznak. A hasonlóság abban is fennáll, hogy az adatok növelésével növelhető a pontosság, de a véletlen elem miatt elvileg nincs lehetőség a determinisztikus előrejelzésre. Az időjárás előrejelzése azonban sokkal pontosabb műfaj, mint egy olyan egyedi lefolyású eseményé, amelyet az emberi viselkedés is befolyásol.

A vírus terjedését matematikai értelemben nem lehet előrejelezni, mert nem ismerjük pontosan a terjedést befolyásoló paramétereket, amelyeknek már kis változtatása is nagyon érzékeny előrejelzési különbségekhez vezet. Az egyes modellek a terjedésre befolyást gyakorló tényezők szerepét tudják bemutatni és ezzel iránymutatást, segítséget adnak mind a döntéshozóknak a közösségi intézkedések meghozatalához, mind az egyéneknek a kockázatot csökkentő viselkedéshez.

Aki többet szeretne olvasni környezeti kérdések matematikai modellezésének és előrejelzésének laikusok által gyakran nem ismert korlátairól, azoknak ajánlom Orrin H. Pilkey és Lina Pilkey-Jarvis könyvét, amelynek címe: Useless arithmetic: why environmental scientists can’t predict the future. Columbia University Press, New York, 2006.

 

Javasolt forrás: https://covid19.healthdata.org/

 

Összeállította:

DUSEK TAMÁS

PhD, egyetemi tanár

Gazdasági Elemzések Tanszék

dusekt@sze.hu