Sprogmodeller kan forbedre fysikmålinger med forbedret Tau -genopbygning

For at finde sjældne processer fra colliderdata bruger forskere computeralgoritmer til at bestemme typen og egenskaberne for partikler baseret på de svage signaler, som de efterlader i detektoren. En sådan partikel er Tau Lepton, der for eksempel produceres i forfaldet af Higgs Boson.

Tau Lepton efterlader en spray eller en jet med lavenergipartikler, hvis subtile mønster i jetflyet giver en mulighed for at skelne dem fra jetfly produceret af andre partikler. Jeten indeholder også oplysninger om Tau Lepton energi, der distribueres blandt datterpartiklerne, og undervejs er forfaldet. I øjeblikket bruger de bedste algoritmer flere trin til kombinatorik og computervision.

Chatgpt har vist meget stærkere ydelse i afvisning af baggrunde end computervisionsbaserede metoder. I dette dokument viste forskere, at sådanne sprogbaserede modeller kan finde Tau Leptoner fra jetmønstrene og også bestemme energi- og henfaldsegenskaberne mere nøjagtigt end før.

Dette kan gøres ved at behandle jetflyet af partikler som en sætning, hvor hvert ord svarer til en partikel og finder forholdet mellem partiklerne ved hjælp af transformeralgoritmen. Sådanne tilgange er lovende, fordi de kunne forbedre forholdet mellem signal og ryggen i fremtidige analyser, der involverer Tau Lepton, såsom søgningen efter dobbelt-Higgs-produktion.

Arbejdet offentliggøres i tidsskriftet Computerfysikkommunikation.