Forskere ved Rice University har udviklet en ny maskinlæringsalgoritme (ML), der udmærker sig ved at fortolke “lette signaturer” (optiske spektre) af molekyler, materialer og sygdomsbiomarkører, hvilket potentielt muliggør hurtigere og mere præcise medicinske diagnoser og prøveanalyse.
“Forestil dig at være i stand til at opdage tidlige tegn på sygdomme som Alzheimers eller Covid-19 bare ved at skinne et lys på en dråbe væske eller en vævsprøve,” sagde Ziyang Wang, en elektrisk og computerteknisk doktorand ved Rice, der er en første forfatter på en undersøgelse offentliggjort i ACS Nano. “Vores arbejde gør dette muligt ved at lære computere, hvordan man bedre kan ‘læse’ signalet om lys spredt fra små molekyler.”
Hvert materiale eller molekyle interagerer med lys på en unik måde og producerer et tydeligt mønster, som et fingeraftryk. Optisk spektroskopi, som indebærer at skinne en laser på et materiale for at observere, hvordan lys interagerer med det, bruges i vid udstrækning i kemi, materialevidenskab og medicin. Imidlertid kan fortolkning af spektrale data være vanskelige og tidskrævende, især når forskelle mellem prøver er subtile. Den nye algoritme, kaldet Peak-Sensitive Elastic-Net Logistic Regression (PSE-LR), er specielt designet til at analysere lysbaserede data.
“De optiske spektre af et væv eller en anden biologisk prøve kan afsløre meget om, hvad der sker inde i kroppen,” sagde Wang. “Dette er vigtigt, fordi hurtigere og mere nøjagtig sygdomsdetektion kan føre til bedre behandlinger og redde liv. Ud over sundhed kan vores metode også hjælpe forskere med at forstå nye materialer, hvilket fører til smartere sensorer og mindre diagnostiske enheder.”
PSE-LR kan ikke kun nøjagtigt klassificere forskellige prøver, men er også gennemsigtige i sin beslutningstagning-noget, som mange avancerede ML-modeller ikke er særlig gode til. PSE-LR leverer et “funktionskort”, der fremhæver nøjagtigt hvilke dele af spektret, der bidrager til en klassificeringsbeslutning, hvilket gør resultaterne lettere at fortolke, verificere og handle på.
“Vores algoritme var designet til at fokusere på de vigtigste dele af signalet; de toppe, der betyder mest,” sagde Wang og sammenlignede PSE-LR med “en detektivlæring for at finde ledetråde skjult i lette signaler.”

Forskerne testede PSE-LR mod andre ML-modeller, der viste forbedret ydelse, især til at identificere subtile eller overlappende spektrale funktioner.
“De fleste modeller savner enten de små detaljer eller er for komplekse til at forstå,” sagde Wang. “Vi havde til formål at løse det ved at bygge noget både smart og forklarbart.”
Modellen fungerede også godt i en række tests, der måler sin virkelige verden, herunder detektering af ultralowkoncentrationer af SARS-CoV-2-pigproteinet i væskeprøver, identificerende neurobeskyttende opløsninger i musens hjernevæv, klassificerer Alzheimers sygdomsprøver og skelner mellem 2D-halvledere.
“Vores værktøj er i stand til at analysere lysbaserede data for meget subtile signaler, der normalt er svære at hente til at bruge traditionelle metoder,” sagde Shengxi Huang, lektor i elektrisk og computerteknik og materialevidenskab og nanoengineering, der er en tilsvarende forfatter i undersøgelsen.
Den nye algoritme kunne muliggøre udvikling af ny diagnostik, biosensorer eller nanodevices.
“Disse fund kan hjælpe med at transformere medicinsk diagnostik og materialevidenskab, hvilket bringer os tættere på en verden, hvor smarte teknologier hjælper med at opdage og reagere på sundhedsmæssige problemer hurtigere og mere effektivt,” sagde Wang.