Jarvis di Google: “il maggiordomo digitale” che cambierà il web

Google si prepara a lanciare Jarvis, un assistente IA che promette di automatizzare ricerche, acquisti e prenotazioni online, pronto a cambiare radicalmente il modo in cui imprenditori e utenti interagiscono con la rete. Intanto Anthropic avanza con il suo Claude 3.5. e Gemini 2.0. è sempre più vicino.
Scopri come le IA possono svolgere i compiti più ripetitivi al posto tuo, lasciandoti più tempo per ciò che conta davvero per far crescere la tua azienda.

Project Jarvis, il nuovo agente IA di Google, ci sostituirà nelle attività più meccaniche e ripetitive, facendo al posto nostro ricerche, acquisti e prenotazioni in rete. Intanto si avvicina il lancio di Gemini 2.0.

Non so se sei tipo da fumetti o film sui supereroi, ma probabilmente conoscerai Tony Stark, l’Iron Man della Marvel.

Bene, devi sapere che l’ho sempre invidiato. Non tanto per l’armatura high-tech o per il conto in banca infinito, ma per quel suo fidato maggiordomo virtuale, J.A.R.V.I.S. – “Just A Rather Very Intelligent System” – ovvero “Solo Un Sistema Piuttosto Molto Intelligente“.

In pratica una versione iper-tecnologica di Alfred, il fido maggiordomo di Batman, per restare in tema fumettistico, sempre pronto a sbrigare le faccende più noiose e ripetitive e accudire l’Uomo Pipistrello come se fosse ancora un bambino.

E se ti dicessi che presto potremmo avere anche noi il nostro Jarvis personale a viziarci e a sbrigare quei compiti che, sia a lavoro, che nella vita privata, non abbiamo più voglia di fare?

Sì, hai capito bene. Google sembra intenzionato a trasformare (anche) questo sogno in realtà.

Se ti stai chiedendo di cosa si tratta e quali conseguenze potrà avere tutto ciò sul tuo business online, lascia che te lo spieghi.

Agents IA dal Google IO 2024

Che cos’è Project Jarvis (e perché dovrebbe interessarti)

Project Jarvis è un agente di intelligenza artificiale sviluppato da Google per automatizzare le attività quotidiane online degli utenti, come condurre ricerche, effettuare acquisti o prenotare voli.

Secondo The Information, un sito specializzato fondato dall’ex giornalista del Wall Street Journal, Jessica Lessin, Jarvis è progettato per operare direttamente all’interno del browser Chrome, grazie alle capacità avanzate della prossima versione di Gemini.

Fonti vicine allo sviluppo di Jarvis descrivono un sistema che soddisfa le richieste degli utenti catturando screenshot dello schermo per interpretare il contesto e il contenuto.

Poi agisce come farebbe un essere umano, utilizzando mouse e tastiera per effettuare ricerche o compilare moduli. Attualmente, Jarvis però non sarebbe particolarmente veloce: si prende una pausa per elaborare ogni passaggio prima di procedere.

Google Jarvis pro e contro grafico realizzato con Napkin

Non è la prima volta che Big G si avventura nel campo degli assistenti IA capaci di svolgere operazioni autonomamente. Nel 2018, l’azienda di Mountain View aveva presentato Google Duplex, un’IA capace di fare telefonate per prenotare appuntamenti, imitandone le sfumature della voce umana per rendere la conversazione più naturale. Sebbene Duplex sia stato integrato anche in Chrome per compiti come l’acquisto di biglietti per il cinema, questa versione è stata chiusa nel 2022.

Eppure, grazie ai recenti progressi nei modelli linguistici di grandi dimensioni (LLM), Google è pronta a scommettere nuovamente sugli assistenti IA.

Sperando che le cose non vadano a finire come nella gif:

Durante l’evento Google I/O del maggio scorso, il CEO di Alphabet e Google, Sundar Pichai, ha illustrato i compiti che potrebbero svolgere questi nuovi “agenti”, dichiarando:

“Gli agenti sono in grado di anticipare diversi passaggi, lavorare su diversi software e sistemi, tutto per portare a termine un compito per conto nostro e, cosa più importante, sotto la nostra supervisione”.

Sundar Pichai

Pichai inoltre ha spiegato che gli agenti IA sono “sistemi intelligenti che mostrano capacità di ragionamento, pianificazione e memoria“.

Immagina, per esempio, di dover restituire un prodotto acquistato online: basterà scattare una foto dell’oggetto, e Jarvis cercherà nella tua Gmail la ricevuta, compilerà il modulo di reso e programmerà un ritiro.

Oppure, se ti stai trasferendo in una nuova città, Jarvis potrebbe trovare per te servizi locali come palestre o supermercati, e aggiornare autonomamente il tuo indirizzo nelle app che utilizzi.

L’arrivo di Gemini 2.0: il motore dietro Jarvis

La vera novità che rende Jarvis possibile è l’atteso lancio di Gemini 2.0, previsto per dicembre 2024, almeno secondo le indiscrezioni pubblicate su The Verge.

Questo nuovo modello seguirebbe Gemini 1.5, lanciato a febbraio 2024, che ha introdotto un’espansione della finestra di contesto, permettendo agli utenti di gestire input più lunghi e complessi. Inoltre, gli abbonati di gemini.google.com hanno avuto accesso a queste funzionalità avanzate a partire da maggio 2024.

Nonostante alcune voci indichino che il modello non sta mostrando i progressi sperati dal team guidato da Demis Hassabis, fresco vincitore del Premio Nobel 2024 per la chimica, è importante notare che questa tendenza sembra essere comune tra le aziende che sviluppano modelli di grandi dimensioni.

Grafica Nobel Chimica 2024 Demis Hassabis

In questo senso, Gemini-1.5-Pro-002 e Gemini-1.5-Flash-002, di cui ti scrissi esattamente un mese fa, a settembre 2024, sembrano quasi una preparazione, un allenamento per Gemini 2.0.

Anche se i dettagli sulle nuove funzionalità sono scarsi, ci si aspetta che Gemini 2.0 offra risposte più intelligenti, elaborazione più veloce e una maggiore capacità di gestire input più lunghi.

Insomma, su questo ci ho preso: Gemini sta davvero rimpiazzando (e migliorando) in tutto e per tutto Google Assistant!

Le indiscrezioni suggeriscono che Google potrebbe presentare una prima versione di Jarvis già a fine 2024, in concomitanza con il lancio di Gemini 2.0., come emerge qui. L’azienda però, prima di annunci ufficiali, starebbe considerando di rilasciare il tool a un numero limitato di tester per identificare e risolvere eventuali bug. Quindi, se sei impaziente di provarlo, potrebbe essere necessario aspettare ancora un po’.

Perché Jarvis è un game changer per gli imprenditori online

Ora, potresti pensare: “Interessante, ma come influisce questo sul mio business online?”

Beh, la risposta è semplice: in molti modi. Se gestisci un sito web o un e-commerce, l’arrivo di Jarvis potrebbe cambiare le modalità con cui gli utenti cercano e acquistano prodotti, come emerge bene da questo pezzo di Android Authority.

Ad esempio, Jarvis potrebbe effettuare acquisti o prenotazioni per conto degli utenti, basandosi su preferenze precedentemente impostate.

Ciò significa che le strategie SEO e di marketing dovranno adattarsi per rimanere efficaci.

Secondo una ricerca di HubSpot, piattaforma che si occupa di marketing digitale, il 75% degli utenti non va oltre la prima pagina dei risultati di ricerca, per cui è evidente che, con Jarvis che filtra le informazioni per loro, competere per quelle prime posizioni diventerà ancora più fondamentale.

I dettagli tecnici: come funziona Jarvis e il ruolo di Gemini 2.0

Jarvis, alimentato da Gemini 2.0 e ottimizzato specificamente per Chrome, funzionerà catturando screenshot del tuo schermo, interpretandoli e poi eseguendo azioni come cliccare su pulsanti o inserire testo nei campi appropriati.

Attualmente, sembra che impieghi alcuni secondi tra un’azione e l’altra, ma ci si aspetta che le prestazioni migliorino con lo sviluppo.

Gemini 2.0 rappresenta un’evoluzione significativa rispetto alle versioni precedenti. Dopo il lancio di Gemini 1.0 nel dicembre 2023 e di Gemini 1.5 nel febbraio 2024, Google ha continuato a perfezionare il suo modello AI. Nonostante alcune sfide tecniche, l’obiettivo è offrire un’esperienza utente più fluida e naturale.

Gemini Live arriva in Italia: l’IA parla la nostra lingua

Ma le novità non finiscono qui. A partire dal 21 ottobre 2024, Gemini Live è disponibile anche in Italia, permettendoci di interagire con l’assistente vocale nella nostra lingua.

Come sai, Gemini è disponibile da noi dal 5 giugno 2024, ma ora, basta aggiornare l’app Google e scaricare l’app Gemini sul tuo smartphone o tablet Android, per poi configurare Gemini Live in italiano.

Gemini Live in Italia pro e contro grafico realizzato con Napkin

Da quel momento, tutte le interazioni con Gemini Live saranno in italiano. Questo significa che puoi chiedere all’assistente di tradurre testi, rispondere a domande complesse, generare contenuti o persino creare immagini realistiche utilizzando il modello Imagen 3 di ultima generazione, come ti ho anticipato in quest’articolo.

Immagine generata da Imagen 3 IA ragazzo che legge un libro sull'Everest
Esempio di immagine generata da Imagen 3

L’assistente è in grado di comunicare con le app di sistema come Gmail, Maps e YouTube, e presto sarà integrato anche con Keep, Calendario e altre utilità. Inoltre, Gemini Live può adattarsi alle tue preferenze e abitudini, offrendo un’esperienza personalizzata e naturale.

Rispetto all’Assistente Google originario, il salto evolutivo è notevole. Con fino a 10 voci diverse tra cui scegliere e la capacità di interromperti per chiedere chiarimenti, Gemini Live rende l’interazione uomo-macchina ancora più fluida. Insomma, sono lontani i tempi in cui ti parlavo delle voci di Gemini, Ruby e River!

Se, ad esempio, ricevi una foto di un piatto delizioso via Gmail, puoi chiedere a Gemini di trovare la ricetta corrispondente e aggiungere gli ingredienti necessari a una lista della spesa su Keep.

La concorrenza non sta a guardare: Microsoft, Apple e Anthropic in campo

Ma, se a Mountain View si preparano a rivoluzionare il web con Jarvis e Gemini 2.0, le altre Big Tech non restano certo a guardare. La corsa all’IA che sa “fare le cose” è in pieno svolgimento, e colossi come Microsoft, Apple e Anthropic stanno investendo massicciamente in questo settore.

Microsoft scommette su Copilot Vision

Microsoft sta lavorando su “Copilot Vision“, un’estensione del suo già noto assistente “Copilot”.

Questa nuova funzionalità permetterà agli utenti di interagire con le pagine web attraverso comandi vocali e di avere conversazioni basate sul contenuto che stanno visualizzando. Immagina di poter chiedere al tuo assistente AI di riassumere un articolo che stai leggendo o di estrapolare dati specifici senza doverli cercare manualmente.

Copilot Vision punta a integrare l’IA in modo ancora più profondo nelle applicazioni Microsoft, come il pacchetto Office e il browser Edge. Questo potrebbe cambiare radicalmente il modo in cui lavoriamo, rendendo più efficienti attività come la gestione delle email, la redazione di documenti e l’analisi di dati.

Apple introduce Apple Intelligence

Anche Apple non è da meno e sta sviluppando “Apple Intelligence“, un sistema di IA progettato per essere consapevole di ciò che accade sullo schermo e agire di conseguenza.

Sebbene l’azienda di Cupertino sia nota per la sua riservatezza sui progetti in sviluppo, fonti interne suggeriscono che Apple Intelligence potrebbe essere integrata nei dispositivi iOS e macOS entro il prossimo anno.

L’obiettivo di Apple è creare un assistente AI che possa operare in modo fluido tra diverse applicazioni, offrendo un’esperienza utente senza soluzione di continuità. Ad esempio, l’AI potrebbe suggerirti di inviare un messaggio a un contatto appena menzionato in una nota o aiutarti a organizzare le tue foto in album tematici senza che tu debba intervenire manualmente.

Anthropic avanza con Claude 3.5: il vero antagonista di Big G (per ora)

Un altro player importante è Anthropic, che ha recentemente annunciato aggiornamenti significativi per i suoi modelli Claude 3.5 Sonnet e Claude 3.5 Haiku, introducendo una nuova funzionalità in versione beta chiamata “Computer Use“, che permette a Claude di utilizzare un computer in modo simile a un essere umano.

La funzione “Computer Use” consente a Claude di interagire con il computer tramite schermo, cursore e tastiera per svolgere varie tipologie di task. Attualmente in fase sperimentale, aziende come Replit e The Browser Company stanno testando questa funzionalità per automatizzare processi complessi e multistep.

Anthropic ha spiegato che, quando gli sviluppatori danno accesso al software, l’IA analizza gli screenshot e calcola i movimenti necessari per interagire con le applicazioni. Questa funzione è accessibile tramite l’API di Anthropic, oltre che su Amazon Bedrock e Google Cloud Vertex AI.

Compiti Claude 3.5. grafico realizzato con Napkin

Nonostante alcuni difetti iniziali—come lentezza e possibilità di errori—l’obiettivo è trasformare Claude 3.5 in un assistente capace di automatizzare operazioni di back-office, come rispondere alle email e gestire attività che richiedono solitamente l’intervento umano.

Secondo Anthropic, la nuova funzione apre nuove prospettive per l’automazione, specialmente in attività che richiedono una combinazione di passaggi manuali e decisioni basate su dati. Le prime fasi di testing hanno dimostrato un forte interesse per l’automazione intelligente, con un impatto diretto su vari settori economici.

grafico su miglioramenti Claude fonte Anthropic ottobre 2024
Fonte Anthropic

Le possibili implicazioni sulla privacy e sulla sicurezza

Ovviamente, con l’aumento delle capacità di questi assistenti AI, sorgono anche preoccupazioni riguardo alla privacy e alla sicurezza dei dati. Come verranno gestiti i dati sensibili? Quali misure saranno adottate per prevenire abusi o accessi non autorizzati?

Con Jarvis che cattura screenshot dello schermo e Claude che interagisce direttamente con applicazioni e sistemi, la gestione sicura delle informazioni diventa una priorità assoluta.

Secondo un sondaggio del 2024, il 53% degli utenti esprime preoccupazioni sulla privacy online.

Sondaggio You Gov su fiducia utenti USA sulle IA 2024

Le aziende tecnologiche dovranno affrontare queste sfide in modo trasparente per guadagnare e mantenere la fiducia degli utenti.

L’IA sta trasformando l’efficienza aziendale: l’adozione consapevole farà la differenza tra successo e rincorsa ai competitor

L’arrivo di Jarvis e gli sviluppi di aziende come Microsoft, Apple e Anthropic potrebbero rappresentare una svolta epocale nel modo in cui interagiamo con il web e gestiamo i nostri business online.

Ti ho mostrato come gli agenti IA, come Jarvis di Google, siano sistemi in grado di portare a termine compiti senza la supervisione umana, che si tratti di controllare un computer o semplicemente di contrassegnare le e-mail come lette.

Come puoi facilmente intuire, se usati con consapevolezza, questi agenti di IA potranno dare una grossa mano ai singoli utenti e alle aziende, semplificando le attività banali, anche se, allo stato attuale, la maggior parte di essi sono ancora in via sperimentale.

Se sei un imprenditore online, ti consiglio di tenere d’occhio l’evoluzione delle IA in questo senso, ma non limitarti a seguire solo Google, anche Microsoft, Apple e Anthropic stanno facendo passi da gigante in questo campo.

Pensa a come adattare le tue strategie di automazione e integrare strumenti avanzati può rendere la tua azienda ancora più efficiente. Non sottovalutare l’impatto che queste soluzioni possono avere sulla produttività e sulla riduzione dei costi operativi.

Metti al primo posto la sicurezza dei dati. Con l’IA che interagisce sempre di più con i sistemi e le informazioni aziendali, è fondamentale proteggere le informazioni sensibili della tua azienda e dei tuoi clienti: un aspetto essenziale per evitare rischi inutili.

Infine, investi nella formazione continua. Dedica tempo e risorse alla tua crescita personale e a quella del tuo team. Comprendere e saper sfruttare al meglio queste nuove tecnologie può fare la differenza tra approfittare delle nuove tecnologie, essere sempre aggiornati o rincorrere i tuoi competitor più lungimiranti.

Non aspettare che siano gli altri a prendere l’iniziativa. È il momento di agire e prepararsi per le sfide e le opportunità che l’IA porterà nel mondo del business online, perché, non si scappa, Gemini, Search GPT e le altri IA stanno davvero riscrivendo internet e saranno vitali per la tua visibilità online, specie su AI Overviews.

Insomma, non pensare che queste IA siano roba da fumetto, riservate ad Iron Man, tecnologie come Jarvis, saranno i nostri “maggiordomi” di domani che, se sai come fare, semplificheranno il modo di fare SEO e ottimizzazione con le IA.

Quindi, cosa stai aspettando?

Non lasciare che il tuo tempo venga divorato da operazioni ripetitive. Abbraccia il cambiamento, trasforma queste novità in un’opportunità concreta e comincia subito: scrivimi e discutiamo delle strategie migliori per fare un salto di qualità.

Takeaways

  • Project Jarvis è stato concepito per sollevare gli utenti da compiti ripetitivi come ricerche, acquisti online e prenotazioni. Grazie alla capacità di operare direttamente su Chrome, Jarvis emula le azioni umane, semplificando la gestione di attività digitali quotidiane.
  • Ispirato da Google Duplex, Jarvis rappresenta il secondo tentativo di Google di implementare un agente AI avanzato. Duplex, introdotto nel 2018 per effettuare prenotazioni telefoniche con voce umana, ha aperto la strada a Jarvis, che ora integra avanzate capacità di elaborazione linguistica e interazione con i dispositivi.
  • Il cuore di Jarvis sarà Gemini 2.0, in arrivo a dicembre 2024. Dopo una serie di miglioramenti, Gemini 2.0 promette risposte più precise, un’elaborazione più rapida e una gestione avanzata di input complessi, permettendo a Jarvis di operare con efficienza nel browser.
  • Con Gemini Live ora disponibile in Italia, gli utenti possono comunicare con l’assistente AI in italiano. Questo supporto linguistico permette un’interazione personalizzata e adattata alle preferenze locali, rendendo l’esperienza ancora più naturale e immediata.
  • L’arrivo di Jarvis cambierà le regole per gli imprenditori digitali. Con un agente AI che assiste gli utenti nelle decisioni di acquisto, la competizione per le prime posizioni nei motori di ricerca diventa ancora più cruciale. Le aziende dovranno adattare le proprie strategie SEO e marketing per mantenere visibilità e competitività in un contesto dominato dall’intelligenza artificiale.

FAQ

Che cos’è Project Jarvis di Google?

Project Jarvis è un agente di intelligenza artificiale sviluppato da Google per automatizzare le attività quotidiane online, come effettuare ricerche, acquisti e prenotazioni. Funziona all’interno del browser Chrome e utilizza la potenza di Gemini 2.0 per eseguire azioni complesse, come interpretare contesti e compilare moduli online.

Quali novità introduce Gemini 2.0 rispetto alle versioni precedenti?

Gemini 2.0, atteso per dicembre 2024, rappresenta un’evoluzione significativa, con miglioramenti in termini di velocità di elaborazione e capacità di gestione di input più lunghi e complessi. Rispetto a Gemini 1.5, introdotto a febbraio 2024, Gemini 2.0 si propone di offrire risposte più intelligenti e un’esperienza più fluida per l’utente.

Perché Project Jarvis è rilevante per gli imprenditori online?

Project Jarvis può cambiare le modalità con cui gli utenti interagiscono con i siti web, facilitando ricerche, acquisti e prenotazioni in modo automatico. Questo significa che gli imprenditori online dovranno adattare le proprie strategie SEO e di marketing per rimanere competitivi e visibili nei risultati di ricerca, considerando l’impatto di un assistente AI che filtra informazioni per conto degli utenti.

Roberto Serra

Mi chiamo Roberto Serra e sono un digital marketer con una forte passione per la SEO: Mi occupo di posizionamento sui motori di ricerca, strategia digitale e creazione di contenuti.

Ricevi i migliori aggiornamenti di settore