L'AI dimostra un teorema. Ma è il matematico a spiegare perché funziona

Il Foglio

L'AI dimostra un teorema. Ma è il matematico a spiegare perché funziona

In un preprint depositato su arXiv da Giorgio Parisi e Francesco Zamponi , l’uso del modello linguistico generativo di Anthropic, Claude , entra direttamente nella costruzione di una prova matematica. Il problema riguarda il jamming, cioè la transizione attraverso cui un sistema disordinato di sfere acquista rigidità meccanica quando la densità supera una soglia critica. In questo modello teorico compaiono tre numeri, chiamati esponenti critici e indicati con (a), (b) e (c), che descrivono come il sistema si comporta vicino alla transizione. Una relazione fra questi esponenti era già stata dimostrata analiticamente; l’identità (a+b=1) era stata osservata numericamente con precisione arbitraria, cioè compariva sempre nei calcoli al computer, ma nessuno era ancora riuscito a dimostrare perché dovesse essere vera a partire dalle equazioni del modello. Parisi e Zamponi scrivono di aver ottenuto quella prova attraverso un’interazione con Claude, nelle versioni Sonnet 4.6 e Opus 4.7, dopo una fase in cui il modello era stato guidato nello studio numerico delle equazioni e nella produzione di codice C++ per verificarne la soluzione ad alta precisione. Gli autori dichiarano di aver controllato la derivazione, corretto alcune inconsistenze iniziali, rifinito il testo matematico e depositato la conversazione completa in un archivio Zenodo. A questo punto, una domanda sorge spontanea: perché un LLM riesce a trovare nuove soluzioni matematiche? La risposta nasce dalla natura stessa di questi sistemi. Un LLM è un modello del linguaggio: riceve una sequenza di simboli e produce una prosecuzione probabile, selezionata in base alle regolarità apprese durante l’addestramento. Nel linguaggio comune questa capacità genera frasi plausibili, argomenti, racconti, spiegazioni. Nel linguaggio matematico genera oggetti di natura diversa: trasformazioni simboliche, passaggi dimostrativi, analogie tecniche, scelte di funzioni test, cambi di variabile, identità candidate, lemmi intermedi. La matematica è un linguaggio molto particolare, perché ammette gradi crescenti di controllo sulle proprie proposizioni. Una frase matematica può essere formulata in modo informale, poi resa tecnica, poi formalizzata, poi verificata riga per riga dentro un sistema di regole esplicite. Questo rende gli LLM sorprendentemente adatti alla fase esplorativa della matematica. Il modello non deve possedere una percezione del mondo esterno, né misurare un fenomeno, né verificare empiricamente una previsione. Deve manipolare proposizioni entro un contesto simbolico già altamente strutturato. Durante l’addestramento ha incontrato milioni di esempi di ragionamento matematico: da questa massa di esempi estrae regolarità probabilistiche per sviluppare proposizioni conseguenti a quelle che gli vengono fornite nei prompt. Quando gli viene presentato un problema nuovo ma strutturalmente vicino a famiglie di problemi già presenti nel linguaggio matematico, quindi, può produrre una mossa plausibile che nessuno aveva ancora provato in quel contesto. La forza dell’LLM sta quindi nella generazione guidata di proposizioni sotto vincoli. Il vincolo iniziale è dato dal prompt, dalle definizioni, dalle equazioni, dagli obiettivi dichiarati. Il vincolo successivo è dato dalla coerenza interna dei passaggi. Il vincolo più forte arriva quando la proposizione viene tradotta in un linguaggio formale e sottoposta a verifica meccanica. In questo senso, la matematica offre agli LLM un ambiente privilegiato: il loro prodotto naturale, cioè il linguaggio, può essere progressivamente irrigidito fino a diventare prova. La stessa sequenza che in un discorso ordinario resterebbe soltanto plausibile può essere trasformata, se corretta, in una derivazione controllabile. Il caso Parisi-Zamponi si colloca precisamente all’incrocio fra esplorazione linguistica e verifica matematica. Claude non ha dovuto inventare dal nulla un nuovo universo concettuale. Ha lavorato su equazioni già date, su un’identità attesa, su vincoli numerici forti, su una struttura teorica molto definita. In un contesto simile, la ricerca matematica assomiglia in parte a un’esplorazione di mosse simboliche possibili: quale funzione test usare, quale quantità derivare, quale termine integrare, dove cercare una cancellazione, come trasformare un’osservazione numerica in una conseguenza analitica. Un LLM è efficace proprio perché può generare molte traiettorie linguistiche dentro questo spazio, selezionando quelle che assomigliano a dimostrazioni riuscite nella letteratura matematica. La differenza rispetto a un motore puramente simbolico è importante. Un sistema basato solo su regole procede con trasformazioni formalmente ammesse, ma può perdersi in uno spazio enorme di possibilità. Un LLM non parte dalla regola astratta applicata in modo cieco; parte da una storia statistica di usi riusciti del linguaggio matematico. Questo gli permette di proporre passaggi che hanno un profilo riconoscibile per un matematico: “qui si potrebbe scegliere questa funzione test”, “qui conviene integrare per parti”, “questa cancellazione sembra naturale”, “questa identità ausiliaria potrebbe chiudere l’argomento”. La proposta resta fallibile. La sua utilità nasce dal fatto che restringe lo spazio della ricerca, offrendo candidati che hanno una forma matematica plausibile. A questo punto entra la verifica. Un LLM, preso da solo, non è un garante di verità matematica – come non è un garante di nessuna verità, perché non ha modo di misurarla. Può produrre una catena di passaggi falsa con una superficie perfettamente convincente. Però la matematica dispone di un criterio interno di controllo: una dimostrazione, una volta formulata, può essere esaminata come sequenza di trasformazioni ammesse. Qui l’accoppiamento fra LLM e verifica diventa decisivo. Il modello genera proposizioni; il controllo matematico elimina quelle scorrette; la formalizzazione può stringere ulteriormente il vaglio. Per questo un LLM può contribuire alla scoperta matematica senza essere, da solo, un’autorità epistemica. La sua funzione primaria è esplorativa; la verità del risultato nasce quando l’esplorazione viene ricondotta alle regole della dimostrazione. La posizione di Tanya Klowden , ricercatrice che lavora sui sistemi di formalizzazione matematica e sull’interazione fra intelligenza artificiale e proof assistant, e di Terence Tao , uno dei matematici più influenti della sua generazione e medaglia Fields nel 2006, rafforza questa lettura . La matematica moderna possiede, almeno in linea di principio, uno standard oggettivo di prova: ogni argomento può essere espanso fino a diventare una sequenza controllabile di applicazioni di assiomi e regole logiche. La pratica ordinaria dei matematici, tuttavia, resta semi-formale. Le prove pubblicate contengono convenzioni, passaggi affidati alla competenza del lettore, routine tecniche, analogie con argomenti noti, valutazioni di plausibilità e controlli esperti sulla struttura complessiva dell’argomento. Gli LLM lavorano proprio in questa fascia intermedia fra il linguaggio informale della matematica umana e la formalizzazione completa. Una volta chiarito perché un LLM può contribuire alla scoperta matematica, emerge una seconda domanda: fino a che punto questi sistemi possono operare senza intervento umano? Se gli LLM sono efficaci perché generano linguaggio matematico plausibile, e se la matematica consente di trasformare quel linguaggio in derivazioni sempre più vincolate, allora un sistema che combini LLM, motore di ricerca, librerie formali e proof assistant automatico può procedere in molti casi senza intervento umano nella verifica locale. Il punto decisivo è il perimetro di questa autonomia. La verifica locale può essere automatizzata perché controlla una relazione definita: da certe premesse formalizzate segue un certo enunciato formalizzato. Il proof assistant non deve sapere perché quel teorema interessi, quale problema abbia motivato quelle definizioni, quale versione della congettura sia davvero significativa, quale formulazione conservi il contenuto concettuale originario. Stabilisce che una derivazione è valida dentro il sistema dato. Questo è moltissimo, ma non coincide con l’intera pratica matematica. Tao e Klowden insistono proprio su questo scarto. La formalizzazione controlla ciò che è stato scritto nel sistema, non il passaggio che porta dal problema informale alla sua codifica. Ed è proprio questo passaggio a essere spesso decisivo: prima ancora di dimostrare qualcosa, bisogna scegliere il formalismo adeguato, cioè costruire un modello concettuale capace di rappresentare ciò che si intende realmente studiare. Anche un enunciato apparentemente elementare può cambiare significato in base a convenzioni tacite, definizioni implicite o scelte di rappresentazione diverse. Una dimostrazione meccanicamente accettata può quindi riguardare una versione diversa, più debole, più forte, più artificiale o semplicemente meno pertinente della domanda iniziale. La prova formale elimina l’ambiguità all’interno del linguaggio scelto; resta però da stabilire se quel linguaggio, con le sue definizioni e i suoi oggetti, costituisca davvero il modello appropriato del problema che si voleva comprendere. Qui si separano tre livelli che il dibattito tende spesso a sovrapporre. Il primo è la correttezza: un enunciato segue oppure non segue da certe premesse secondo certe regole. Il secondo è la comprensione: non basta sapere che la prova funziona; bisogna anche capire perché il risultato è vero, quali idee lo rendono possibile e quale struttura matematica mette in luce. Una prova può quindi essere corretta senza essere particolarmente illuminante. Il terzo è il valore: il risultato apre un campo, chiarisce un fenomeno, unifica casi diversi, produce nuove domande, oppure resta una soluzione locale di scarso significato. Un LLM, collegato a verificatori formali, può avanzare molto nel primo livello. Può contribuire al secondo suggerendo analogie, strategie e spiegazioni, ma senza garanzia autonoma. Sul terzo livello il giudizio resta legato alla posizione del risultato nel paesaggio della disciplina. Questa distinzione permette di evitare due equivoci. Da un lato, la matematica prodotta con l’aiuto di un LLM non è epistemicamente inferiore per il solo fatto di essere stata trovata da una macchina. Se la dimostrazione è corretta, è matematica corretta. Dall’altro lato, una prova corretta non basta a esaurire ciò che i matematici cercano in una dimostrazione. Una prova può essere valida e opaca, valida e fragile, valida e poco istruttiva, valida e formulata in modo tale da nascondere la struttura che rende il risultato interessante. Tao e Klowden parlano, in questo senso, del rischio di prove prive di “odore” matematico: argomenti accettabili sul piano formale, ma poveri di contenuto esplicativo. Il futuro più probabile non è la sostituzione semplice del matematico con un generatore automatico di teoremi. È una redistribuzione del lavoro. Le parti deduttive più verificabili potranno essere affidate sempre più spesso a sistemi automatici. Passaggi oggi liquidati con formule come “per argomenti standard” potranno essere espansi da software capaci di generare e controllare derivazioni. La ricerca di lemmi intermedi potrà diventare più rapida. L’esplorazione di casi e varianti potrà essere moltiplicata. Il lavoro umano tenderà a concentrarsi maggiormente sulla scelta dei problemi, sulla costruzione delle definizioni, sulla formulazione delle congetture, sulla valutazione della pertinenza e sulla ricerca di spiegazioni che rendano la prova parte di una teoria comprensibile. Dentro questa cornice, il caso Parisi-Zamponi rappresenta un esempio particolarmente istruttivo dell’interazione fra un modello linguistico e una disciplina fondata su proposizioni vincolate. Il modello ha potuto muoversi perché il problema era già strutturato: equazioni note, identità attesa, verifica numerica ad alta precisione, cornice teorica stabile. La scoperta consisteva nel trovare il passaggio analitico mancante. Questo tipo di lacuna è particolarmente adatto a un sistema capace di generare molte mosse matematiche plausibili e di far emergere, tra esse, una traiettoria che un esperto può controllare. Un documento recentemente sottoscritto da matematici e studiosi dell’AI, noto come dichiarazione di Leiden , introduce un piano diverso. Il suo bersaglio principale non è la possibilità che l’AI produca matematica corretta. La dichiarazione riguarda le condizioni sociali e istituzionali della matematica nell’epoca dell’AI: rigore, attribuzione, trasparenza, responsabilità, accesso agli strumenti, autonomia della ricerca, controllo pubblico delle infrastrutture. Gli autori richiamano rischi concreti: risultati inaffidabili presentati con eccessiva sicurezza, difficoltà di revisione, debito verso la letteratura incorporata nei modelli senza attribuzione adeguata, dipendenza da piattaforme proprietarie, diseguaglianze di accesso, comunicazione industriale aggressiva, deformazione delle agende di ricerca. Questi problemi non rispondono alla domanda epistemica iniziale. Una dimostrazione assistita da AI può essere corretta se viene ricondotta a una derivazione verificabile. Il fatto che un modello sia proprietario, che il training set sia opaco o che un’azienda promuova i propri risultati in modo enfatico non rende falsa una prova valida. Allo stesso tempo, la correttezza di una singola prova non risolve i problemi posti da Leiden. Una comunità può produrre risultati veri e, nello stesso tempo, diventare dipendente da infrastrutture private, perdere trasparenza, attribuire male il lavoro intellettuale, lasciare che gli incentivi commerciali orientino le domande ritenute importanti. La confusione nasce quando i due piani vengono usati l’uno contro l’altro. L’efficacia tecnica degli LLM nella matematica non cancella le questioni di potere, accesso e attribuzione. Le questioni di potere, accesso e attribuzione non cancellano il fatto che un sistema automatico possa contribuire a una prova vera. Tao e Klowden aiutano a capire come l’AI possa entrare legittimamente nel lavoro matematico: generazione di candidati, formalizzazione, verifica, aumento della capacità esplorativa. Leiden richiama le condizioni necessarie perché quell’ingresso non danneggi la disciplina come pratica collettiva: trasparenza, responsabilità umana, attribuzione, standard di revisione, infrastrutture pubbliche, controllo degli incentivi industriali. Da questo punto di vista, il lavoro di Parisi e Zamponi costituisce un esempio particolarmente vicino allo spirito della dichiarazione: gli autori non si sono limitati a presentare il risultato finale, ma hanno reso disponibile l’intera interazione con Claude, inclusi i prompt, le risposte del modello, i tentativi intermedi, gli errori corretti e il percorso che ha portato alla dimostrazione. In questo modo il contributo dell’AI non viene nascosto né mitizzato, ma documentato in modo verificabile, consentendo alla comunità di valutare sia la correttezza del risultato sia il ruolo effettivamente svolto dal sistema automatico nel processo di scoperta. Una conseguenza interessante di questa trasformazione è che la matematica potrebbe diventare il laboratorio privilegiato per capire che cosa significhi davvero collaborare con sistemi artificiali. In poche altre discipline è possibile separare con tanta chiarezza la generazione di idee dalla loro validazione. Questo permette di osservare in modo relativamente controllato quali aspetti della ricerca possono essere delegati a strumenti automatici e quali continuano a dipendere dal giudizio umano. Questa trasformazione offre anche l’opportunità di chiarire che cosa consideriamo essenziale nell’attività scientifica: la capacità di trovare risultati, quella di spiegarli, quella di collegarli a problemi più ampi o quella di decidere quali domande meritano di essere poste. La matematica, proprio perché dispone di criteri di verifica particolarmente rigorosi, offre oggi uno dei contesti migliori per affrontare queste domande senza confondere il successo operativo di un sistema con la comprensione del significato dei risultati che produce.

Go to News Site

AppGallery

Google Play

App Store