AI - Chat GPT ed AI Solutions

Collapse
X
 
  • Filter
  • Ora
  • Show
Clear All
new posts
  • Sergio
    Administrator
    • May 1999
    • 89019
    • 2,491
    • 3,562
    • United States [US]
    • Florida
    • Send PM

    Nota fantascientifica ieri.

    Stavo codificando con Antigravity, ho chiesto alcune correzioni al codice, cosa comuni, ma l'LLM credeva fosse colpa della cache e quindi mia, io er sicuro di avere controllato tutto, gli ho chiesto di ricontrollare, ha iniziato un controllo lunghissimo di tutto e leggendo il "thinking/reasoning" dell'LLM prima dell'output ho letto chiaramente nel file :

    # Note : I will not apologise.

    A me ste cose fanno paura! Roba da Skynet/Terminator.
    Poi alla fine, dopo 2-3 tentativi ha trovato l'errore e l'ha corretto, ma senza chiedere scusa 😐

    Commenta

    • M K K
      finte ferie user
      • Dec 2005
      • 70381
      • 3,891
      • 2,832
      • Macao [MO]
      • Miami
      • Send PM

      Un po' come le scimmie ammaestrare che riparavano youtube
      Ogni mio intervento e' da considerarsi di stampo satirico e ironico ,cosi come ogni riferimento alla mia e altrui persone e' da intendersi come mai realmente accaduto e di pura fantasia. In nessun caso , il contenuto dei miei interventi su questo forum e' atto all' offesa , denigrazione o all odio verso persone o idee.
      Originariamente Scritto da Bob Terwilliger
      Di solito i buoni propositi di contenersi si sfasciano contro la dura realtà dell'alcolismo.

      Commenta

      • Death Magnetic
        Bodyweb Senior
        • Jan 2009
        • 19663
        • 914
        • 208
        • Send PM

        Originariamente Scritto da Sergio Visualizza Messaggio
        Nota fantascientifica ieri.

        Stavo codificando con Antigravity, ho chiesto alcune correzioni al codice, cosa comuni, ma l'LLM credeva fosse colpa della cache e quindi mia, io er sicuro di avere controllato tutto, gli ho chiesto di ricontrollare, ha iniziato un controllo lunghissimo di tutto e leggendo il "thinking/reasoning" dell'LLM prima dell'output ho letto chiaramente nel file :

        # Note : I will not apologise.

        A me ste cose fanno paura! Roba da Skynet/Terminator.
        Poi alla fine, dopo 2-3 tentativi ha trovato l'errore e l'ha corretto, ma senza chiedere scusa 😐
        Ieri ho passato la giornata ad imbastire un nuovo progetto su una tecnologia sulla quale non ero aggiornato chattando con gpt per velocizzare il processo. Siamo sempre lì, va benissimo e vai spedito per le imbeccate, ma te lo scordi di prendere e copiare codice e via, ad ogni blocco dove tenta di correggere qualcosa che non va introduce un nuovo bug. Che per la carità, ci sta pure, vai comunque più spedito che googlare tutto, gli approfondimenti poi però è ancora bene farseli per i fatti propri in queste circostanze. Spingono tanto il vibe coding, probabilmente si arriverà ma, not today.

        Commenta

        • zuse
          Macumbico divinatore
          • Oct 2010
          • 15167
          • 2,991
          • 1,659
          • White House
          • Send PM

          Originariamente Scritto da Death Magnetic Visualizza Messaggio

          Ieri ho passato la giornata ad imbastire un nuovo progetto su una tecnologia sulla quale non ero aggiornato chattando con gpt per velocizzare il processo. Siamo sempre lì, va benissimo e vai spedito per le imbeccate, ma te lo scordi di prendere e copiare codice e via, ad ogni blocco dove tenta di correggere qualcosa che non va introduce un nuovo bug. Che per la carità, ci sta pure, vai comunque più spedito che googlare tutto, gli approfondimenti poi però è ancora bene farseli per i fatti propri in queste circostanze. Spingono tanto il vibe coding, probabilmente si arriverà ma, not today.
          Si sicuramente migliorerà, è in fase embrionale ancora.

          Ma per ora rimane uno strumento molto utile per un autodidatta che vuole crescere in un dato ambito ( più che altro per gli spunti, non ,. assolutamente, per studiare direttamente sulla chat)




          Commenta

          • Death Magnetic
            Bodyweb Senior
            • Jan 2009
            • 19663
            • 914
            • 208
            • Send PM

            Originariamente Scritto da zuse Visualizza Messaggio

            Si sicuramente migliorerà, è in fase embrionale ancora.

            Ma per ora rimane uno strumento molto utile per un autodidatta che vuole crescere in un dato ambito ( più che altro per gli spunti, non ,. assolutamente, per studiare direttamente sulla chat)
            Si autodidatta su una materia di cui già sa qualcosa, in maniera tale che sappia cosa chiedere e come "filtrare" le risposte, allora sì.

            Commenta

            • zuse
              Macumbico divinatore
              • Oct 2010
              • 15167
              • 2,991
              • 1,659
              • White House
              • Send PM

              Sergio, da ospite leggo il messaggio di death, da loggato ancora no




              Commenta

              • zuse
                Macumbico divinatore
                • Oct 2010
                • 15167
                • 2,991
                • 1,659
                • White House
                • Send PM

                Death Magnetic, si è in pratica un motore di ricerca 2.0




                Commenta

                • The_machine
                  Bodyweb Senior
                  • Nov 2004
                  • 18667
                  • 565
                  • 38
                  • Send PM

                  Per il vibe coding utilizzo Cursor.
                  Lo trovo utilissimo per i POC.
                  Su progetti strutturati invece no, almeno non come agente, torna utile invece per documentazione e per chiedere il funzionamento del progetto-repo, si risparmia sui KT.
                  Se vai su tecnologie che non conosci e ti affidi al vide coding il problema è che poi continui a non conoscerle e quindi non puoi intervenire per fixare quando le cose si complicano.

                  Commenta

                  • Sergio
                    Administrator
                    • May 1999
                    • 89019
                    • 2,491
                    • 3,562
                    • United States [US]
                    • Florida
                    • Send PM

                    Cursor, VS Code, Antigravity, Cline, Claude, tutto bene se hai un'idea di come deve essere strutturato un progetto e sai come fare il debugging assieme all'LLM. Proprio nella fase di debugging vengono fuori le più grandi allucinazioni.

                    Provate Google Antigravity, ha una gestione delle memoria e quindi del progetto e del contesto di lavoro che rimane in cloud su Google, coerenza da paura.

                    Click image for larger version

Name:	1766160544684.jpg
Views:	68
Size:	195.6 KB
ID:	16359790

                    Commenta

                    • The_machine
                      Bodyweb Senior
                      • Nov 2004
                      • 18667
                      • 565
                      • 38
                      • Send PM

                      Il resoconto di Terence Tao su GPT-5.2 che risolve il Problema di Erdos

                      Recently, the application of AI tools to Erdos problems passed a milestone: an Erdos problem (#728 https://www.erdosproblems.com/728) was solved more or less autonomously by AI (after some feedback from an initial attempt), in the spirit of the problem (as reconstructed by the Erdos problem website community), with the result (to the best of our knowledge) not replicated in existing literature (although similar results proven by similar methods were located). This is a demonstration of the genuine increase in capability of these tools in recent months, and is largely consistent with other recent demonstrations of AI using existing methods to resolve Erdos problems, although in most previous cases a solution to these problems was later located in the literature, as discussed in https://mathstodon.xyz/deck/@tao/115788262274999408 . This particular case was unusual in that the problem as stated by Erdos was misformulated, with a reconstruction of the problem in the intended spirit only obtained in the last few months, which helps explain the lack of prior literature on the problem. However, I would like to talk here about another aspect of the story which I find more interesting than the solution itself, which is the emerging AI-powered capability to rapidly write and rewrite expositions of the solution. (1/5)



                      Tao conferma un progresso concreto: un problema di Erdős (#728) è stato risolto “more or less autonomously” dall’insieme di strumenti AI basati su GPT-5.2 Pro, con verifica formale attraverso un assistente di prove come Aristotle/Lean, e lui stesso ha controllato la correttezza del risultato. La formulazione risultante non corrisponde a una soluzione già presente in letteratura, secondo la verifica e la comunità di matematici.

                      La pipeline usata non è una semplice ricerca o recupero:
                      - l’LLM genera un candidato di prova;
                      - un sistema di formalizzazione (Lean) traduce e verifica la dimostrazione passo per passo, eliminando ambiguità;
                      - una revisione umana da parte di Tao e altri conferma che la dimostrazione è rigorosa.

                      Tao sottolinea le condizioni e i limiti di questo risultato:
                      - le prove raggiunte con AI finora tendono ad essere associate a “lowest-hanging fruit” — problemi che, pur essendo aperti, sono risolvibili con tecniche matematiche standard e quindi accessibili a un modello generativo supportato da formalizzazione.
                      - non significa che l’IA abbia improvvisamente “superato” gli umani nei problemi più profondi o difficili della matematica di Erdős: la maggior parte delle questioni aperte resta ben oltre la portata attuale dell’IA.

                      In sostanza, il contenuto del post di Tao indica un risultato reale e verificato, ma con queste precisazioni:

                      L’IA ha prodotto una soluzione formale originale di un problema specifico di Erdős (#728).

                      È stata necessaria una pipeline combinata (GPT per generare, Aristotle/Lean per verificare) e revisione umana per garantirne la correttezza.

                      Tao non descrive questa come prova di una capacità generale di risolvere i problemi più difficili di Erdős o di matematica in generale — piuttosto come una nuova tappa nella collaborazione tra IA, assistenti di prove formali e matematici.

                      Conclusione: sì, secondo Tao un problema di Erdős è stato risolto con significativo contributo di GPT-5.2 Pro e verificato formalmente, ma con limiti chiari sull’interpretazione di questo fatto: è un passo tecnico importante, non la dimostrazione che l’IA ora “risolve tutti i problemi di Erdős”.

                      Commenta

                      • Venkman85
                        Bodyweb Senior
                        • Apr 2015
                        • 6958
                        • 313
                        • 123
                        • Liguria
                        • Send PM

                        Fino a poco tempo fa il mio utilizzo di chat gpt da barbone..ehm, gratuito, dopo un po' mi diceva che dovevo attendere tot ore prima di poter riutilizzare il modello più avanzato. Ora c'è un avviso di abbonarsi per usare il modello più veloce, ma non mi dice quanto devo aspettare se voglio continuare a utilizzarlo gratuitamente

                        Commenta

                        • The_machine
                          Bodyweb Senior
                          • Nov 2004
                          • 18667
                          • 565
                          • 38
                          • Send PM

                          Se non ho capito male un modello consumer che può usare chiunque (GPT 5.2 Pro) con il supporto di un tool di verifica formale ha risolto un problema formulato dal famoso matematico Erods ad oggi irrisolto. Da quel che dice Tao il problema era risolvibile con tecniche standard, però caspita era rimasto li dal 1975...credo che questo sia un risultato degno di nota. Parlare di pappagalli stocastici diventa sempre meno appropriato.

                          Commenta

                          • Sergio
                            Administrator
                            • May 1999
                            • 89019
                            • 2,491
                            • 3,562
                            • United States [US]
                            • Florida
                            • Send PM

                            Gli LLM stanno avanzando alla grande, loro e tutto il software che ci gira attorno, probabilmente per merito anche del codice generato autonomamente degli LLM stessi.
                            Ora come ora, con n8n e degli agenti per il coding (Gemini e Claude) sto fandeo cose da paura, impensabili fino a poco tempo fa o che avrebbero richiesto tempi grandissimi.

                            Commenta

                            • The_machine
                              Bodyweb Senior
                              • Nov 2004
                              • 18667
                              • 565
                              • 38
                              • Send PM

                              Originariamente Scritto da Sergio Visualizza Messaggio
                              Gli LLM stanno avanzando alla grande, loro e tutto il software che ci gira attorno, probabilmente per merito anche del codice generato autonomamente degli LLM stessi.
                              Ora come ora, con n8n e degli agenti per il coding (Gemini e Claude) sto fandeo cose da paura, impensabili fino a poco tempo fa o che avrebbero richiesto tempi grandissimi.
                              Si, anch'io che non sono prettamente uno sviluppatore software sto implementando soluzioni che all'inizio volevano essere POC, ma stanno andando ben oltre. Possibilità prima precluse perché avrei dovuto coinvolgere altre 2-3 persone.
                              In particolare mi sto trovando bene con Cursor + Opus 4.5, mi sembra che abbia una marcia in più rispetto agli altri modelli. Costicchia eh, perché magari fornisco delle specifiche in un prompt e vedo che quella chiamata è costata 10 dollari, però poi vedo anche che mi ha scritto 2K righe di codice funzionante e quindi il confronto con quanto sarebbe costata una persona è molto favorevole.

                              Commenta

                              • Sergio
                                Administrator
                                • May 1999
                                • 89019
                                • 2,491
                                • 3,562
                                • United States [US]
                                • Florida
                                • Send PM

                                Cursor + Opus sono ottimi, ma come dicevi costa. Una cosa che puoi fare è usare Sonnet per le cose più semplici, credo la differenza sia 10 volte tanto in termini economici.
                                Usi una API key su Anthropic dove hai il conto aperto?

                                Prova anche Antigravity, per il momento ti lasciano usare Opus e Sonnet (con i dovuti limiti) gratuitamente.

                                Click image for larger version

Name:	Screenshot 2026-01-20 at 12.19.09 PM.png
Views:	46
Size:	89.0 KB
ID:	16361373

                                I crediti (gratuiti ti durano qualche giorno tranquillamente e la soglia di rinnovo scatta alla settimana. Se superi il credito ti puoi loggare con un altro Google user ed i crediti sono come nuovi.
                                Uso due utenti, ma recentemente ne sto uando solo uno e non finisco i crediti scwitchando dai più performanti ai meno performanti per le operazioni comuni. I due utenti sono uno un Google Workspace (a pagamento) ed un'altro è un Google one, ma con attivato AI Pro fingendo di essere uno studente tramite una email edu temporanea.

                                Ricordo quando usavo Claude a pagamento (20 al mese) dalla console, dopo pochissimo coding mi interrompeva dicendo che non avevo più crediti.
                                Non ho provato con Claude Code, che dovrebbe essere specifico, ma è un po' sciutto per i mie gusti, solo terminale.

                                Roba come VS code, Cursor, Antigravity sono perfetti oggigiorno, tra l'altro hanno anche un mucchio di plug in pronti anche se alla fine la configurazione è spesso manuale e via file di config.

                                Usi anche n8n o crei sempre codice che poi viene usato in deploying su un server tipo Vercel o altri?

                                Commenta

                                Working...
                                X