Agosto 2024 - Fabrice Grinda

Fabrice AI è una rappresentazione digitale dei miei pensieri basata su tutti i contenuti del mio blog. Vuole essere un assistente interattivo e intelligente in grado di comprendere e rispondere a domande complesse con sfumature e precisione.

Fabrice AI è nato come un esperimento, una ricerca personale per esplorare il potenziale dell’intelligenza artificiale creando una versione digitale della vasta conoscenza che ho condiviso nel corso degli anni. Inizialmente lo immaginavo come un progetto semplice, da realizzare in poche ore. Il piano era semplice: caricare i miei contenuti nell’API di OpenAI e permettere all’intelligenza artificiale di interagire con essi, creando così un assistente accessibile e intelligente in grado di fornire risposte articolate basate sulla ricchezza di informazioni che avevo condiviso.

Tuttavia, quando ho intrapreso questo viaggio, è apparso subito evidente che il compito era molto più complesso di quanto avessi previsto. Il progetto, che pensavo sarebbe stato una breve incursione nell’IA, si è rapidamente trasformato in un’impresa completa e intricata, che richiedeva molto più di un semplice caricamento superficiale di dati. Si è trasformato in un’immersione profonda nelle complessità dell’IA, dell’elaborazione del linguaggio naturale e della gestione della conoscenza.

La sfida principale che ho affrontato non riguardava solo l’archiviazione delle informazioni, ma anche l’insegnamento all’intelligenza artificiale a comprendere, contestualizzare e recuperare accuratamente quelle informazioni in modo da riflettere la profondità e le sfumature dei miei contenuti originali. Ciò ha richiesto un approccio sfaccettato, poiché ho scoperto che i semplici metodi di archiviazione e recupero dei dati erano insufficienti per la complessità delle domande che volevo che Fabrice AI gestisse.

Il viaggio mi ha portato ad affrontare una vasta gamma di approcci, dai primi tentativi di utilizzare indici di ricerca vettoriali a metodi più avanzati che coinvolgono grafi di conoscenza, recupero di metadati e modelli di IA personalizzati. Ogni approccio aveva i suoi punti di forza e di debolezza e ognuno mi ha insegnato qualcosa di nuovo sulle complessità dell’IA e sulle sfumature della gestione digitale della conoscenza. Descriverò in dettaglio il percorso tecnico intrapreso nel prossimo post del blog.

Al di là dei problemi tecnici, anche la generazione di una base di conoscenze esaustiva si è rivelata una sfida. Nelle prime fasi di test dell’accuratezza dell’IA, mi sono reso conto che le risposte più dettagliate e precise ad alcune domande erano quelle fornite nelle interviste video o nei podcast. Per essere accurata, avevo bisogno che la base di conoscenze includesse tutti i miei post, le interviste video, i podcast, le presentazioni PowerPoint, le immagini e i documenti PDF.

Ho iniziato trascrivendo tutti i contenuti. Dato che le trascrizioni automatiche sono approssimative, ho dovuto assicurarmi che l’intelligenza artificiale comprendesse il contenuto. Questo ha richiesto molto tempo perché ho dovuto testare le risposte per ogni contenuto trascritto.

Anche se le trascrizioni mi separavano dall’altro parlante, l’intelligenza artificiale ha pensato che il 100% del contenuto parlato fosse mio, il che ha richiesto un ulteriore addestramento per assicurarsi che fosse in grado di distinguere correttamente entrambi i parlanti su tutto il contenuto. Volevo anche che l’intelligenza artificiale di Fabrice desse più peso ai contenuti recenti. Naturalmente, la prima volta che ho provato a farlo ha utilizzato la data in cui ho caricato il contenuto su LLM piuttosto che la data in cui ho pubblicato l’articolo, il che ha richiesto ulteriori aggiustamenti.

Per completezza, ho anche trascritto le conoscenze contenute nelle diapositive che ho condiviso sul blog utilizzando il modello OCR di Azure per la conversione da immagine a testo e ho caricato i file nella base di conoscenze dell’assistente GPT. Allo stesso modo, ho scaricato i PDF dalla libreria multimediale di WordPress e li ho caricati nella base di conoscenze.

Durante il beta testing, ho notato che molti dei miei amici mi hanno posto domande personali che non sono state trattate nel blog. Sto aspettando di vedere il tipo di domande che le persone mi faranno nelle prossime settimane. Completerò le risposte nel caso in cui non sia possibile trovarle con i contenuti esistenti sul mio blog. Nota che sto intenzionalmente limitando le risposte di Fabrice AI ai contenuti del blog, in modo che tu abbia veramente Fabrice AI e non un mix di Fabrice AI e Chat GPT.

Vale la pena ricordare che ho seguito un percorso lungo per arrivare a questo punto. Ho iniziato utilizzando GPT3 ma sono rimasto deluso dai risultati. Continuava a utilizzare le fonti sbagliate per rispondere alle domande, anche se alcuni post del blog avevano esattamente la risposta alla domanda posta. Nonostante le decine di ore di lavoro per cercare di fargli utilizzare i contenuti giusti (di cui parlerò nel prossimo post), non ho mai ottenuto risultati che mi soddisfacessero.

Le cose sono migliorate con GPT3.5, ma erano ancora deludenti. Ho quindi creato un’applicazione GPT nel GPT Store utilizzando GPT Builder. Funzionava un po’ meglio ed era più economica da gestire. Tuttavia, non sono riuscito a farla funzionare sul mio sito web ed era disponibile solo per gli abbonati a pagamento di Chat GPT, il che mi sembrava troppo limitante. In ogni caso, non mi piaceva la qualità delle risposte e non mi sentivo a mio agio nel rilasciarlo al pubblico.

La svolta è arrivata con il rilascio di GPT Assistants utilizzando il modello 4o. Senza che io dovessi dirgli quali contenuti utilizzare, ha iniziato a capire da solo e tutto ha funzionato meglio. Ho abbandonato l’approccio dell’applicazione GPT e sono tornato a utilizzare l’API per poterla incorporare nel blog. Per completezza, ho testato anche Gemini, ma ho preferito le risposte fornite da GPT4o.

Per il momento sto rilasciando una versione solo testo. Include una funzione voice-to-text che ti permetterà di porre le tue domande a voce. Sto studiando alcuni modi per creare una versione interattiva che abbia il mio aspetto e la mia voce e con cui tu possa conversare. Ho un prototipo funzionante ma non sono affatto soddisfatto dei risultati e del costo potenziale. Voglio assicurarmi che parli in prima persona, che abbia davvero il mio aspetto e il mio suono e che non mi costi un occhio della testa.

Vedremo quanti progressi farò nei prossimi mesi, ma potrebbe avere senso aspettare il GPT5. Col senno di poi, avrei risparmiato centinaia di ore di lavoro se avessi aspettato il GPT4o per sviluppare Fabrice AI. D’altra parte, l’indagine faceva parte dello scopo ed era super interessante.

Nel frattempo, gioca con Fabrice AI e fammi sapere cosa ne pensi!

Fabrice Grinda

Mese: Agosto 2024

Ti presentiamo Fabrice AI

Fabrice Grinda

Subscribe to Fabrice's Newsletter

Subscribe to Fabrice's Newsletter