Cosa sono i Soft 404 e perché Google gli ha dichiarato guerra

Gary Illyes, alto dirigente di Big G ha spiegato su LinkedIn che gli errori Soft 404, confondono i motori di ricerca danneggiando la SEO.
Ma cosa sono questi problemi nel dettaglio e perché Google vuole contrastarli ancora più seriamente?

Gary Illyes, importante dirigente di Big G, spiega perché i Soft 404 sono un problema

Gary Illyes, analista di Google, ovvero quella figura che raccoglie e analizza dati per migliorare prodotti e servizi dell’azienda, si è scagliato contro i Soft 404 su LinkedIn e ha cercato di spiegare ai lettori cosa fare, ma soprattutto cosa NON fare per risolvere il problema.

I post sull’argomento sono stati ben 5, tra il 24 Giugno 2024 e il primo Luglio 2024, per cui è chiaro che l’argomento gli sta particolarmente a cuore.

Gary Illyes di Google su LinkedIn post del 25 Giugno 2024 sui soft 404

Illyes su LinkedIn lo riconosci perché dalla foto sembra Wolverine, e ogni volta che scrive un post guadagna subito la mia attenzione.

Ma uscendo dalla mia fantasia di Illyes-Wolverine, vorrei riportarti un suo esempio sui soft 404 che mi pare azzeccato:

“Immagina di entrare in un caffè, consulti il menu online e ordini il tuo preferito latte speziato al mais con latte di yak. L’impiegato ti dice che non ce l’hanno. Ok, provi con un espresso mezzo. Niente. Un tè con latte di castagne d’acqua? Nulla di fatto. Frustrante, vero? Ora immagina se i motori di ricerca avessero la stessa esperienza sul tuo sito web. Ecco a cosa somigliano i Soft 404: pagine che promettono contenuto ma offrono solo delusioni”.

Illyes-Wolverine

Da queste sue parole cosa hai capito?

Che i Soft 404 sono il male e bisogna sapere come contrastarli.

E che Illyes, ha dei gusti discutibili in fatto di caffè.

Ma ora, a meno che tu non sia un esperto del settore, ti sarai chiesto cosa sono questi temibili Soft 404. Vediamolo meglio.

Che cosa sono i soft 404 e perché furono introdotti

Con i Soft 404, in parole povere, la pagina dice ai motori di ricerca “Tutto bene qui”, quando in realtà è vuota o non ha il contenuto previsto. E questo crea confusione per quei piccoli robot digitali che scandagliano il web per indicizzare i contenuti.

Google Search Console, lo strumento gratuito offerto da Google che aiuta i proprietari di siti web a monitorare, mantenere e ottimizzare la loro presenza nei risultati di ricerca, è il sistema che segnala questo tipo di problema (nonostante anche lui commetta degli errori come ti spiego in questo video).

Ma quando accade questo e soprattutto perché?

Semplice: quando una pagina appare vuota o con contenuti scarsi, restituendo un codice 200 (OK) invece di un 404 (Not Found).

Ciò succede per problemi tecnici o in caso siano state eliminate pagine, come è ben spiegato in quest’articolo di Search Engine Journal.

Essi sono stati introdotti nella Search Console per segnalare questo tipo di problematica in modo chiaro e ben separato rispetto ai 404 standard.

Tuttavia, invece di risolvere il problema, hanno finito per complicare ulteriormente le cose.

Ma che differenza c’è tra i comuni errori 404 e questi nuovi “simpatici amici” capaci di distruggere la reputazione del tuo sito?

Le differenze tra i Soft 404 e gli errori 404 tradizionali

Prima però di dirti la differenza tra questo tipo di errori, è meglio dirti cosa sono i crawler come quello di Google, fidati ti servirà…

Un crawler è un software utilizzato dai motori di ricerca per scandagliare il web in modo automatizzato. Il suo compito è visitare le pagine web, leggere i contenuti e seguire i link presenti per scoprire nuove pagine.

I dati raccolti dai crawler vengono poi indicizzati per permettere ai motori di ricerca di fornire risultati pertinenti agli utenti. In pratica, un crawler è come un esploratore del web che raccoglie informazioni per organizzare e aggiornare i database dei motori di ricerca.

Sei ancora con me? O anche la tua attenzione risulta “File non trovato”?

Ecco, dopo questa piccola ma doverosa premessa, veniamo alla differenza tra questi due tipi di errori.

L’errore 404, noto come “Not Found”, è uno dei codici di stato HTTP più riconoscibili su internet.

Immagine esemplificativa di 404 file not found Google

La sua origine risale ai primi giorni del World Wide Web, creato dai pionieri di internet al CERN nei primi anni ’90, quando i primi sviluppatori necessitavano di un modo per segnalare che una pagina richiesta non esisteva.

La designazione “404” fa parte della famiglia di codici 4xx, che indicano errori client, suggerendo che il problema è dovuto a una richiesta errata del browser.

I 404 tradizionali si verificano quando una pagina risulta non esistente e il server restituisce un codice 404, indicando chiaramente ai crawler che la pagina non è disponibile. Semplice, no?

Invece, i Soft 404 ingannano i Google crawler (questi subdoli maledetti… perdonami, mi stava partendo l’embolo!), facendo loro credere che la pagina esista quando in realtà non ha nessun contenuto utile. Questa differenza può sembrare sottile, ma fidati, ha un grande impatto sul modo in cui i motori di ricerca indicizzano e classificano le pagine del tuo sito.

I Soft 404 possono apparire per vari motivi, tra cui:

  • Errori di configurazione del server, il server potrebbe essere configurato per restituire un codice 200 anche per le pagine inesistenti;
  • Pagine di errore personalizzate, alcuni siti web utilizzano pagine di errore personalizzate che non restituiscono il corretto codice di stato HTTP;
  • Contenuti spostati o rimossi, quando i contenuti vengono spostati o rimossi senza una corretta gestione delle redirezioni, possono verificarsi Soft 404.
Esempio errore soft 404 fonte Yoast 27 Giugno 2019
Esempio soft 404, fonte Yoast

Ma cos’ha detto il dirigente di Google Gary Illyes e perché le sue parole sono così rilevanti?

Gary Illyes di Big G tuona contro i Soft 404 (e si trasforma in Wolverine)

Ma torniamo al nostro Gary Illyes, analista di Big G (e membro degli X-Men).

Sempre su LinkedIn, ha spiegato che quando un crawler incontra una pagina con un Soft 404, interpreta erroneamente che la pagina sia utile e continua a tornare, sprecando il crawl budget“.

Questo budget è la quantità di risorse che un motore di ricerca dedica a scandagliare un sito web, e ogni volta che un crawler visita una pagina inutile, si spreca un’opportunità di indicizzare contenuti reali e utili.

Se vuoi approfondire ne parlavo nel dettaglio qui: Crawl Budget: Cos’è e come ottimizzarlo per la SEO (Spiegato facile)

Illyes consiglia vivamente di restituire i corretti codici di stato HTTP quando si verifica un errore.

Se un server o un client incontrano un problema, dovrebbero servire il codice di stato appropriato, come il 404 per “Not Found”.

Questo aiuta i crawler a capire meglio il sito e a spendere le loro risorse in modo più efficiente.

Secondo Illyes, i Soft 404 sono dannosi perché:

  1. Spreco di Risorse, il crawl budget limitato viene sprecato su pagine che non offrono alcun valore;
  2. Impatto sulla SEO, durante l’indicizzazione, queste pagine vengono filtrate e non compaiono nei risultati di ricerca, il che significa che il traffico organico ne risente.

Per risolvere questo problema, Illyes suggerisce di evitare di chiamare funzioni di backend costose sulle pagine di errore personalizzate.

Gary Illyes di Google su LinkedIn 28 Giugno 2024 su soft 404

Perché Big G “odia” i Soft 404? (La risposta è sempre la stessa…)

Abbiamo visto come una pagina 404 comporta un elevato costo di risorse e ciò può portare a un esaurimento delle risorse del server, causando ulteriori problemi di accessibilità e prestazioni.

Facciamo un esempio con i siti di eCommerce.

Spesso questi affrontano problemi di Soft 404 quando le pagine dei prodotti vengono rimosse o esaurite.

Ad esempio, se un utente cerca “sedie blu” e finisce su una pagina che non ha più sedie disponibili, la pagina potrebbe restituire un codice 200 OK invece di un 404 o 410 (un 410 è un contenuto che prima era lì, ma ora è “GONE”, andato, dissolto nell’etere).

Questo induce Google a sprecare risorse indicizzando pagine non valide, riducendo l’efficienza del crawl budget e danneggiando l’esperienza utente, come si evince da questo bell’articolo di Search Engine Roundtable.

Ma ora ti starai chiedendo perché tutta questa attenzione da parte di Big G per questo tipo di problemi.

Scommetto che lo stai già sospettando…

La risposta è semplice, quanto banale e te lo dirò senza eufemismi.

Perché i Soft 404 costano tempo e soprattutto denaro a Google!

I data center di Google, strutture che gestiscono enormi volumi di dati, sono progettati per essere efficienti dal punto di vista energetico e ogni volta che si imbattono in errori del genere sprecano davvero tante risorse, sia in termini di energia che di denaro.

Proprio per questo motivo i Soft 404 sono un grosso problema, come i gusti in fatto di caffè di Gary Illyes.

Mi scusi signor Wolverine, scherzavo…

Takeaways

  • I Soft 404 si verificano quando una pagina restituisce un codice 200 (OK) invece di un errore 404, confondendo i motori di ricerca e sprecando risorse.
  • Questi errori fanno credere ai crawler che la pagina sia valida, portandoli a visitarla ripetutamente senza valore aggiunto, consumando il crawl budget.
  • Gary Illyes ha sottolineato su LinkedIn l’importanza di risolvere i Soft 404 per migliorare l’efficienza e l’indicizzazione dei contenuti.
  • Possono derivare da errori di configurazione del server, pagine di errore personalizzate o contenuti rimossi senza corretta gestione delle redirezioni.
  • Ottimizzare i contenuti delle pagine vuote, utilizzare correttamente Google Search Console per identificare e risolvere i Soft 404, e restituire i codici di stato HTTP appropriati come il 404 o 410.

FAQ

Cosa sono i Soft 404 e perché sono un problema?

I Soft 404 si verificano quando una pagina restituisce un codice 200 (OK) invece di un errore 404, facendo credere ai motori di ricerca che la pagina sia valida. Questo crea confusione per i crawler e spreca risorse preziose.

Come vengono identificati i Soft 404?

Google Search Console segnala i Soft 404 quando una pagina appare vuota o con contenuti scarsi ma restituisce un codice 200 (OK) invece di un 404 (Not Found).

Qual è la soluzione per i Soft 404?

Per risolvere i Soft 404, è consigliabile ottimizzare i contenuti delle pagine, utilizzare lo Strumento Controllo URL per richiedere la reindicizzazione, e restituire i corretti codici di stato HTTP come il 404 o 410.

Roberto Serra

Mi chiamo Roberto Serra e sono un digital marketer con una forte passione per la SEO: Mi occupo di posizionamento sui motori di ricerca, strategia digitale e creazione di contenuti.

Ricevi i migliori aggiornamenti di settore