Introduzione: cos’era la SEO fino ad oggi
4 o 5 anni fa l’ottimizzazione dei contenuti SEO era basata su diverse tecniche SEO, un po’ white hat e un po’ black hat (perchè funzionanvano!). Oggi però Google non giudica più allo stesso modo i contenuti. Compare dunque il bisogno di avere un approccio semantico ai contenuti e alla SEO, il che vuol dire comprendere lo studio dell’information retrieval e di come si comporta Google oggi.
Partiamo dalla base: quello che ogni SEO conosce sono i concetti di keyword proximity, keyword prominence e keyword density, forse non conoscerete il nome esatto, ma state sicuri che li state applicando. Forse conoscerete anche la keyword stuffing (sperando invece che questa non l’applichiate più ;). Facciamo un breve ripasso dell’ottimizzazione dei contenuti:
- la keyword density è il numero di volte in cui si riprete la prola chiave / numero delle parole del documento. Non esiste una percentuale perfetta, non ossessionatevi, ma yoast e altri si aggirano intorno al 4%. La keyword stuffing era la sovra ottimizzazione di questa partica…
- keyword prominence è la prossimità cioè la vicinanza della parole (quelle che seo garden chiama chiavi civetta). insomma quando fate la keyword research e ci infilate parole correlate, long tail sinonimi ecc quelle sono parole vinine alla vostra keyword.
- Keyword proximity invece si basa sulla posizione delle parole chiave, h1, metatag, ecc…se non vi ricordate bene questi concetti potete fare un ripasso veloce qui, tanto l’articolo non scappa.
L’evoluzione degli algoritmi di Google: il nuovo motore di ricerca semantico
nel 2013 arriva Humming bird, l’aggiornamento dell’algoritmo di google più importante dopo il 2001. Huming bird considera ogni parola, ma anche ogni frase, ma anche l’intera conversazione (da keyword a query verso topic). L’algoritmo diventa intelligentissimo, parla la nostra lingua e comprende. Arriva così l’era del SEO copywrite, cioè l’era in cui si cerca di applicare le conoscenze degli algortmi per l’applicazione alla scrittura. un SEO copywriter sostanzialmente conosce le tecniche come Latent Sematic Index e cerca di applicare tutte le regole seguendo una formulazione semplice e scorrevole nel testo. La SEO diventa una materia olistica in quanto siete tenuti a sapere le basi di sematica cognitiva, information retrivial, etimologia delle parole ecc oltre alle solite tecniche SEO per l’ottimizzazione dei contenuti.
Con tutti i nuovi algoritmi l’evoluzione di è indirizzata verso nuove aree:
Macro Aree
- passare da keyword ad argomenti “thing, no more strings”. Qui trovate un bell’approfondimento al grafo delle reti
- utilizzare le base dell’information retrieval per il mutamento – patent
“Information retrieval (IR) is the activity of obtaining information resources relevant to an information need from a collection of information resources. Searches can be based on metadata or on full-text (or other content-based) indexing.”
Micro Aree
- l’apprendimento automatico, il machine learning e l’intelligenza artificiale sul quale si innesta la valutazione del comportamento utente all’interno delle SERP attraverso il Relevance Feedback (RF). (di fatti di recente è uscita la release di TensorFlow, la libreria software per la machine intelligence sulla quale è stato sviluppato RankBrain, il terzo più importante fattore di ranking ufficialmente riconosciuto da Google )
- l’applicazione del modello probabilistico invece di quello vettoriale di information retrieval, arricchiti da un numero sempre maggiore di altri fattori come ad esempio la LSA (Latent Semantic Analysis) e la Decomposizione a Valori Singolari (DVS) o l’adozione delle Support Vector Machine (SVM) in qualità di classificatori.
Lo sviluppo di una strategia SEO è vincolata alla conoscenza di queste aree. Nasce infatti una Nuova Seo, più che white hat. Nasce la SEO olistica perchè i consulenti SEO adesso sono “obbligati” a conoscere tematiche diverse quali linguaggi di programmazione, linguistica e semantica che vanno oltre i banali corsi seo che trovate sul web. Ora non vi scoraggiate e proseguite la lettura per le spiegazioni 😉
Una visione olistica della SEO – Latent Semantic index
Latent semantic indexing (LSI) is an indexing and retrieval method that uses a mathematical technique called singular value decomposition (SVD) to identify patterns in the relationships between the terms and concepts contained in an unstructured collection of text. -Wiki
Put simply, latent semantic indexing allows the algorithm to differentiate the meaning of language used within a document. –Vin D’Eletto, WordAgents.com
Di solito quando si fa un’analisi SEO di un contenuto la visione è molto rigida: nel contenuto esiste oppure no quella parola chiave? quando si parla di semantica invece si sposta l’attenzione dalla parola chiave all’argomento (da keyword a topic). Se cominciamo a ragionare in questo modo molti contenuti che sono indicizzati con keyword diverse possono essere correlati sul campo semantico. Esiste per questa analisi un indice chiamato Latent Sematic Index che calcola la vicinanaza semantica in base alla co-occorenza delle parole chiave (su tuttti i documenti!). Facciamo un esempio, se in un documento sono contenute le parole marketing e seo e in un altro (diversamente posizionato) compaiono le stesse parole allora l’algoritmo di ricerca calcola un punteggio di vicinanza. in sostanza sul sito il topic è discusso più o meno ampiamente. Da qui potete capire come una keyword research categorizzata per argomento vi aiuta a posizionarvi su topic e non keyword e quindi unendo tutto i vostri documenti avrete un indice di sematica latente più alto.
Come funziona il Latent Semantic Index
- crea una lista completa di parole
- toglie articoli, preposizioni , congiunzioni , toglie i verbi comuni, pronomi, aggettivi comuni(pulisce i dati)
- calcola le co-occorrenze in ogni documento (keyword density)
- calcola le co-occerrenze in tutti i documenti (topic density)
- crea una matrice con n.documenti analizzati, parole chiave e co-occorrenze.
- decomprine l’enorme matrice usando una tecnica chiamata Decomposizione a Valori Singolari (DVS) (approfodimento matematico) . SVD riesce a cogliere tutte le distanze tra i vettori di un documento (co-occorenze) riducendole ad un formato più leggibile e compresso. in questo modo non vengono perse informazioni, ma si puliscono i dati e si elimina il “rumore” statistico.
7. una volta che ha agito SVD serve quella che si chiama stemming. SVD è un algoritmo matematico che attua dei calculi sui vettori, ma non riesce ad assegnare importanza alle parole sulla base della linguistica e l’etimologia. Lo stemming pulisce i dati in base al lessico (che varia per ogni lingua) ripulendo ad esempio, plurali, aggettivi ecc e trasformando le parole tutte sulla stessa base per ottimizzare l’analisi. lo stemmig serve per noramlizzare i dati insomma.una volta finila la pulizia ci ritroviamo un modello del genere
keyword1:00000700
keyword2:00300001
cioè calcoliamo quante volte viene ripetuta la parola all’interno di un documento e vari documenti. Quella che in ottica SEO si chiama keyword density(frequenza keyword/tot parole articolo) cioè il numero di volte in cui compare la parola chiave viene trasformata in “peso locale”( calcolata tramite “local weight algorithm) , mentre nei vari documenti si chiama “global term weight” calcolata con una tecnica che si chiama “inverse document frequency”
8. l’ultimo step serve per dare il peso ai valori calcolati. la parola chiave che compare in più documenti avrà un punteggio maggiore di quella che compare più volte ma in un solo documento. Questo processo si chiama normalizzazione e assegna un punteggio ai documenti basati sulla frequenza e la lunghezza.
9. LSI si otgtiene moltiplicando il local weight, global weight e normalizzazione
Cosa centra la sematica con la SEO? dalla teoria all’azione
a questo punto sembra chiaro, ma passiamo alla parte operativa. come posso mettere in pratica tutto queste cose? per prima cosa fate una keyword research più completa possibile (qui trovate la lista degli strumenti completi per un SEO ninja ;). poi ordinatela per topic e create una strategia di contenuti. Esiste poi un tool che vi permette di associare le parole chiave sulla base dell’algoritmo appena descritto –tool
sostanzialmente dovete fare una bella keyword research focalizzandovi molto sulla correlazione tra le parole, in termini tecnici, analisi delle corrispondenze. Esistono diversi tool e medoti per trovare le parole chiave correlate, il più semplice è google suggest
dopodichè soffermatevi sui sinonimi delle parole. Fate una bella analisi etimologica e grammaticale e aiutate il motore di ricerca a capire meglio quello di cui state parlando (approfondimento)
approfondimenti LSI:
- ricerche universitarie 1 e 2
- http://www.seobook.com/lsi/lsa_biblio.htm
- tutti i tool che ti servono per una vera keyword research