AI-program spiller det lange spil for at løse årtier gamle matematikproblemer

Et skakspil kræver, at dets spillere tænker flere bevægelser foran, en færdighed, som computerprogrammer har mestret gennem årene. Tilbage i 1996 slog en IBM -supercomputer berømt den daværende verdensskakmester Garry Kasparov. Senere, i 2017, sejrede et kunstig intelligens (AI) -program udviklet af Google Deepmind, kaldet Alphazero, over datidens bedste edb -skakmotorer efter at have trænet sig til at spille spillet i løbet af få timer.

For nylig er nogle matematikere begyndt at aktivt forfølge spørgsmålet om, hvorvidt AI -programmer også kan hjælpe med at knække nogle af verdens hårdeste matematiske problemer. Men mens et gennemsnitligt skakspil varer ca. 30 til 40 træk, kræver disse matematikproblemer på forskningsniveau løsninger, der tager en million eller flere skridt eller træk.

I et papir, der vises på arxiv Preprint Server, et team ledet af Caltechs Sergei Gukov, John D. MacArthur-professor i teoretisk fysik og matematik, beskriver udvikling af en ny type maskinlæringsalgoritme, der kan løse matematiske problemer, der kræver ekstremt lange sekvenser af trin. Holdet brugte deres nye algoritme til at løse familier med problemer i forbindelse med et overordnet årtier gamle matematikproblem kaldet Andrews-Curtis-formodningen. I det væsentlige kan algoritmen tænke længere frem end endda avancerede programmer som Alphazero.

“Vores program har til formål at finde lange sekvenser af trin, der er sjældne og svære at finde,” siger Study First -forfatter Ali Shehper, en postdoktor ved Rutgers University, som snart vil tilslutte sig Caltech som forsker. “Det er som at prøve at finde din vej gennem en labyrint på størrelsen på jorden. Dette er meget lange stier, som du er nødt til at teste ud, og der er kun en sti, der fungerer.”

Brugen af ​​AI til at løse matematiske problemer er blevet mere og mere populært. Google Deepminds alfaproof udført på niveau med en sølvmedalist i 2024 International Mathematical Olympiad, en matematikkonkurrence på gymnasiet. Og Openais O3 -program begrundede for nylig vej gennem benchmark -problemer inden for matematik, videnskab og computerprogrammering.

De Caltech-ledede matematikere fokuserer ikke på rutinemæssige problemer, men snarere de hårdeste inden for deres felt. I den nye undersøgelse brugte de AI til at løse to familier med problemer inden for Andrews – Curtis -formodningen, et gruppeteori -problem, der først blev foreslået for 60 år siden.

Mens de ikke løste selve antagelsen selv, modbeviste de familier af problemer, omtalt som potentielle modeksempler, som havde forblevet åbne i cirka 25 år; De gjorde også betydelige fremskridt med en anden familie af modeksempler, der har været åben i 44 år. Modeksempler er dybest set matematiske tilfælde, der ville modbevise en original formodning. Hvis modeksemplerne i sig selv er modbevist, kan den oprindelige formodning stadig være sand.

“At udelukke nogle af modeksemplerne giver os tillid til gyldigheden af ​​den oprindelige formodning og hjælper med at opbygge vores intuition om hovedproblemet. Det giver os nye måder at tænke over det på,” siger Shehper.

Gukov siger, at det at navigere i disse matematiske problemer er som “at komme fra A til B” via indviklede ruter, der kræver tusinder, millioner eller endda milliarder af trin. Han sammenligner problemerne med at løse en utrolig kompleks Rubiks terning.

“Kan du tage denne krypterede, komplicerede Rubiks terning og få den tilbage til sin oprindelige tilstand? Du er nødt til at teste disse meget lange bevægelsessekvenser, og du ved ikke, om du er på den rigtige vej indtil slutningen,” Siger Gukov, der også er direktør for Caltechs nye Richard N. Merkin Center for Pure and Applied Mathematics.

AI-program spiller det lange spil for at løse årtier gamle matematikproblemer

Holdets AI -program lærte at komme med lange bevægelser af bevægelser – hvad forskerne kaldte “superbevægelser” – det er uventede, eller hvad forskerne kalder outliers. Dette står i kontrast til, hvordan AI -programmer som ChatGPT fungerer.

“Hvis du beder Chatgpt om at skrive et brev, vil det komme med noget typisk. Det er usandsynligt, at det kommer med noget unikt og meget originalt. Det er en god papegøje,” siger Gukov. “Vores program er godt til at komme med outliers.”

For at træne deres AI-program brugte forskerne en maskinlæringsmodel kendt som forstærkningslæring. Først viste teamet AI -lette problemer at løse og gav det gradvis sværere og sværere problemer.

“Det prøver forskellige træk og bliver belønnet for at løse problemerne,” forklarer Shehper. “Vi opfordrer programmet til at gøre mere af det samme, mens det stadig holder et vist niveau af nysgerrighed. I sidste ende udvikler det nye strategier, der er bedre end hvad mennesker kan gøre. Det er magien med forstærkningslæring.”

På nuværende tidspunkt er AI -programmer typisk ikke særlig gode til at forudsige afgrænsede, sjældne begivenheder, der har dramatiske konsekvenser, såsom nedbrud på det finansielle marked. Holdets nye algoritme kan heller ikke komme med forudsigelser som denne, men det kan indeholde frøene til, hvad der ville være nødvendigt for at gøre intelligente forudsigelser af denne art. “Grundlæggende ved vores program, hvordan man lærer at lære,” siger Gukov. “Det tænker uden for kassen.”

Holdets nye algoritme har allerede lavet en stor plask i matematikfællesskabet.

“Vi foretog en masse forbedringer i et matematikområde, der var årtier gammel,” siger Gukov. “Fremskridt havde været relativt langsomt, men nu er det trængende og travlt.”

Faktisk er tre nye matematikere tilsluttet sig holdet – Lucas Fagan og Zhenghan Wang fra UC Santa Barbara, og Yang Qiu fra Nankai University i Tianjin, Kina – og gruppen har lagt et andet fortrykspapir, der rapporterer, der løser endnu flere familier af potentielle counterfactuals, der hører til til Andrews – Curtis -formodningen.

I stedet for at opskalere AI -modellerne, har holdets tilgang været at finde nye smarte tricks og strategier, der ikke kræver store mængder computerkraft.

“Vi forsøger at demonstrere god ydelse på småskala computere, let tilgængelige for et lille akademisk samarbejde, så nogen af ​​vores kolleger over hele kloden let kan gengive disse resultater,” siger forskerne.