Studiu despre modele preventive de prognostic pe termen lung pentru COPD folosind machine learning si deep learning
Context
COPD este o cauza importanta de mortalitate la nivel mondial, iar costurile de tratare a acesteia sunt susceptibile de a creste. Modelele de invatare automata si invatare profunda sunt tot mai folosite pentru a previziona progresia pe termen lung a pacientilor cu COPD pentru a economisi costuri si a imbunatati eficienta prestarii ingrijirilor de sanatate.
Invatarea profunda utilizeaza structuri ierarhice pentru a invata structuri si relatii complicate, in timp ce invatarea automata utilizeaza algoritmi pentru a invata reguli si corelatii din date. Invatarea profunda capata popularitate ca mijloc de identificare a pacientilor cu COPD cu risc de rezultate slabe.
Despre studiu
In prezentul studiu, cercetatorii au evaluat in mod comparativ performanta predictiva a modelelor de invatare profunda si invatare automata pentru COPD.
Echipa a cautat in bazele de date Cochrane Library, PubMed, ProQuest, Embase, Web of Science si Scopus de la inceputul studiilor pana la 6 aprilie 2023 pentru studii relevante publicate in limba engleza care au utilizat invatarea profunda sau invatarea automata pentru a estima rezultatele pacientilor ≥6.0 luni dupa diagnosticul initial de COPD. Cercetarile manuale ale referintelor incluse si revizile sistematice au fost realizate pentru a identifica studiile omise.
Echipa a inclus studii cu participanti umani cu varsta cuprinsa intre 18 si 90 de ani, cu o istorie de COPD de cel putin 6.0 luni, permițand modalități de intrare. Studiile au documentat valorile ariei sub curba caracteristicii de operare a receptorului (AUC) pentru estimarea deceselor, a exacerbărilor și a reducerii volumului expirator forțat într-o secundă (FEV1). Au fost incluse studii de cohorta retrospectivă și prospectivă, studii transversale, studii de caz și control și studii clinice randomizate. Studiile prognostice pentru dezvoltarea COPD la persoanele care nu aveau initial COPD au fost excluse, la fel ca și acelea de prognostic care nu au inclus cel putin sase luni de urmarire. Doi cercetatori au facut screening-ul datelor in mod independent, iar eventualele dezacorduri au fost rezolvate prin discutie sau consultare cu un alt cercetator. Cercetatorii au evaluat homogenitatea folosind statistica lui Cochran (valoarea I² peste 50% indicand o heterogenitate semnificativa). Au evaluat riscurile de bias si calitatea raportarii folosind instrumentele PROBAST și TRIPOD.
Invatarea automata a fost descrisa ca algoritmi mai complexi decat modelele de regresie, inclusiv masini de suport vectorial si analize de padure aleatoare, care puteau invata sa faca judecati pe baza de modele din date. Invatarea profunda a fost definita ca utilizarea rețelelor neuronale cu ≥2.0 straturi ascunse. Hospitalizarea a fost folosita ca un proxy pentru agravarea starii de santate, iar modificările în performanța testului de mers pe jos de șase minute, dispneea sau incarcarea cu COPD, asa cum a fost determinat prin chestionare sau masuratori psihofizice, au fost utilizate ca indicatori surrogat pentru reducerea FEV1.
Rezultate
Echipa a identificat initial 3.620 de studii, dintre care 18 au indeplinit criteriile de eligibilitate, dintre care sase au folosit invatarea profunda si 12 modele de invatare automata.
Sapte modele au evaluat riscurile de exacerbare; cu toate acestea, doar șase au raportat valori AUC (AUC combinat, 0,8). Valoarea I² de 97% a indicat o heterogenitate semnificativa in studiile incluse.
Unsprezece modele au estimat riscurile de deces; totuși, doar șase au raportat valori AUC (AUC combinat, 0,8) cu o heterogenitate semnificativa (I² de 60%). Două studii au evaluat reducerile funcției pulmonare, dar nu au putut fi grupate.
Reductia functiei pulmonare de >30 mL in cinci ani a fost prezisa cu AUC 0,8 pe un cohorte de 42 de persoane folosind validare incrucisata de cinci ori, iar declinul general al volumului pulmonar a fost prezis cu AUC 0,7 in randul a 4.496 de pacienti folosind validare incrucisata de 10 ori. Modelele bazate pe invatare profunda si invatare automata nu au aratat nicio imbunatatire semnificativa in estimarea exacerbărilor comparativ cu scorurile existente de severitate a bolii. Trei studii au evaluat comparativ modelele bazate pe invatare automata si scorurile de severitate a bolii pentru estimarea mortalitatii, iar cinci studii de validare externa au aratat o performanta mai slaba decat modelarea de regresie.
Riscurile de bias au fost atribuite in principal manipularii incorecte a informatiilor lipsa, utilizarii seturilor de date prea mici și neinregistrarii incertitudinii modelului.
Meta-analiza a indicat nicio diferenta semnificativa in AUC grupat intre modelele de invatare automata si modelele de regresie conventionale (valori AUC grupate, 0,77 vs. 0,75).
Studiul a constatat ca 50% dintre cele 12 studii de invatare automata aveau un raport eveniment pe variabila sub 10, cu un numar median de evenimente pozitive de 82 și 154 de variabile predictibile. Cele șase studii rămase aveau un raport EPV de peste 20, cu un eveniment pozitiv median de 1.645 și o variabilă predictivă de 11,5.
Pe baza constatarii studiului, exista dovezi insuficiente ca modelele de invatare profunda si invatare automata depasesc scorurile de severitate COPD preexistente pentru prognosticul COPD pe termen lung. Cercetătorii ar trebui să urmeze criteriile PROBAST si TRIPOD pentru a spori reproducibilitatea constatarilor studiului.
Datorita cantitatii de variabile necesare, modelele conventionale au o aplicabilitate clinica limitata. Cu toate acestea, exista mai multe sanse in practica clinica pentru evaluarea invatarii profunde a datelor tomografice computerizate (CT).