lunedì 4 maggio 2009

Manipolare Google Suggest ... si puo'?

Google suggest è quella funzionalità che ci permette di ricevere suggerimenti "in real time" mentre digitiamo una query su Google. Nei giorni scorsi ho ricevuto una richiesta di aiuto da parte di un nostro cliente che si è visto improvvisamente affiancare al proprio Nome e Cognome una parola "sgradita"... quindi, se avevamo già lavorato sulla "Brand protection" di alcuni nostri clienti nei risultati delle ricerche (cercando di "far sparire" risultati sgraditi o peggio diffamatori, quando non in presenza di casi da http://www.chillingeffects.org/), devo dire che questa è stata la prima volta di una simile attività e assistenza.


E' stato abbastanza divertente e interessante approfondire la questione per cercare di eliminare "l'abbinamento sgradito" non soltanto perchè la cosa ha poi avuto un lieto fine, ma anche perchè ci ha permesso di scoprire un gran numero di casi , diciamo, "curiosi" e anche fatto venire la voglia di provare qualche sperimentazione per "manipolare" a proprio favore i suggerimenti prodotti dal sistema.


Avevo letto di un caso simile occorso a Beppe Grillo che al contrario aveva gridato alla "censura" per il fatto che Google Suggest non suggerisse "Grillo" a coloro che digitavano "Beppe" (!) e a sentir lui pare che la cosa si fosse sistemata a seguito delle numerose proteste sue e dei suoi lettori (mah!) .


Prima veniamo ai fatti: Il cliente non è un personaggio troppo "famoso" il numero di risultati collegati alla SERP "Nome e Cognome" non è altissimo, ma nonostante questo digitandola, Google suggerisce una alternativa abbastanza "sgradita" (non citero' il caso specifico ma il fastidio è pari alla situazione dell' immagine qui sopra se osservata da un cuore viola come il mio!). La query suggerita è abbastanza antipatica, non proprio diffamatoria ma quasi...


Li' per li' mi sono abbastanza preoccupato presupponendo che il sistema scegliesse i propri suggerimenti in funzione soprattutto delle "query" piu' cercate dagli utenti e che quindi poco si potesse fare... ma mi sono dovuto ricredere.


Seguendo la "query sgradita" infatti la Serp forniva davvero un numero molto esiguo di risultati e coincidenza (!) il fatto avveniva a pochi giorni di distanza da una attività di Article Marketing e diffusione di comunicati stampa online fatta per il cliente. Ebbene diversi di quei risultati puntavano a siti su cui avevamo pubblicato il nostro articolo ma su cui erano anche presenti (ovviamente!) numerosissimi altri articoli fra cui alcuni che contenevano in maniera massiccia quella "keyword" che ora Google Suggest abbinava al Nome + Cognome del nostro cliente...


Non abbiamo fatto nemmeno a tempo a contattare Google come indicato nelle FAQ del servizio perchè di primo istinto abbiamo eliminato gli articoli pubblicati (è bastato levarne due!) da quei siti su cui era presenta la parola "sgradita" che nel giro di due giorni la query è sparita dai suggerimenti di Google Suggest... con grande sollievo del nostro cliente.


Resta il dubbio se l'abbinamento delle query fosse avvenuto proprio a seguito del "boost" avuto nei giorni di pubblicazione degli articoli e che poi sia naturalmente scomparso nei giorni successivi oppure se davvero è dipeso dall'eliminazione dell pagine.


Tutto bene quel che finisce bene? si, ma la questione vale un approfondimento... ora è vero che Google dichiara che "Cerchiamo di non suggerire ricerche che potrebbero risultare offensive per un gran numero di utenti. Ciò include termini pornografici, parolacce e parole ostili o violente. Se incontri delle ricerche che non dovrebbero essere suggerite, contattaci sul forum di assistenza di Google Ricerca Web" ma basta fare qualche ricerca per trovare situazioni di ogni tipo: (provate per credere)


Alla povera Veronica Lario viene abbinata la parola "a bo rto" , a Simona Ventura "Co caina", ad Umberto Bossi viene dato addirittura del "Comunista" , Pippo Baudo invece a "M o r t o" !!!


Ma come Google sceglie certi suggerimenti? A differenza di Grillo io credo sia una questione tutta algoritmica, (la cosa è interessante soprattutto pensando di testare manipolazioni che permettano di avere suggerimenti "favorevoli" e "graditi") ma i fattori sono evidentemente di due tipi:


-da una parte certamente il numero di query degli utenti (come si evince in numerosi "suggerimenti" legati a fatti di attualità o comunque di cui si percepisce che possano essere oggetto di numerose ricerche)


- dall'altra pero' fattori puramente "semantici" e di presenza di abbinamenti con le parole chiave presenti in documenti e pagine web... non si spiegherebbero altrimenti suggerimenti tipo "Veronica Lario a b o r t o s e t t i m o mese" che non voglio pensare sia una query molto digitata... Cosi' come avviene ad esempio per "Silvio Berlusconi altezza" o "Paolo Bonolis Altezza" o ancora "Pippo Baudo Altezza" o "Giulio Andreotti Altezza" tanto che Google suggest sembra avere davvero un debole per l'altezza dei personaggi famosi...


E sono proprio questi ultimi i fattori che sembrano alla portata di una possibile "forzatura", spesso , per esempio, il suggerimento sembra essere "spinto" dalla presenza dell'abbinamento delle keywords coinvolte su wikipedia, o su servizi come Yahoo Answer ... ho provato a fare qualche test.. vi diro' se porta a qualcosa. ;-)

Aggiornamento: Devo per forza segnalare (e mi scuso del ritardo!) altri interessanti casi e articoli intorno a "Google Suggest" , alcuni davvero esilaranti!
http://blog.tagliaerbe.com/2008/08/google-suggest-pro-e-contro.html
http://punto-informatico.it/1494295/PI/News/google-suggest-favorisce-pirateria.aspx
http://www.gekissimo.net/2009/04/divertirsi-con-google-suggest-spiando.html
http://www.paulthewineguy.com/post/99593435/google-suggest-sempre-peggio-questa-storia-mi
http://www.ziosteve.com/altro/google-suggest-risultati-consigliati/
http://www.ikaro.net/articoli/cnt/google_suggest-00788.html

Buon divertimento! ;-)

10 commenti:

Chiara ha detto...

Ottimo spunto Nicola, in effetti questo aspetto non viene normalmente preso nella dovuta considerazione. In effetti credo che l'utente inesperto e disorientato dall'utilizzo della funzione di ricerca, usi con una certa frequenza i suggerimenti di Google e tenerli monitorati e poter addirittura indirizzarli verso un certo risultato o comunque evitarne altri, potrebbe essere davvero importante. Rimango sintonizzata per gli ulteriori sviluppi del test.

Marco Ziero ha detto...

Sono d'accordo con te circa i due fattori: non era corretto affermare che non ci fosse una correlazione tra quanto suggerito e quanto effettivamente cercato.

Inizialmente ho pensato ai casi in cui la ricerca restituisse pochi documenti, immaginando che Google, con la volontà di "allargare la tendina", pescasse i termini suggeriti altrove.

La tua case history è una conferma di ciò. Curioso che tu abbia trovato casi simili sempre per "nome di qualcuno"+"qualcosa"; in questo senso sarebbe interessante trovare casi più generici, appunto per mettere un piede nel meccanismo al senso opposto: manipolare GSuggest.

Tecnicamente, se l'ultima considerazione che hai fatto (Wikipedia, Yahoo! Answer) è corretta, basterebbe individuare gli hub e fare keyword stuffing? :)

Grazie mille, Nicola, per aver condiviso questa tua esperienza.

Attendo i risultati del test.

Un saluto

Marco Cilia ha detto...

molto interessante!

Francesco ha detto...

Ciao Nicola, complimenti per l'aderenza all'attutalità di questo tuo intervento. Grazie per aver condiviso osservazioni e best practice, attendiamo gli esiti dell'esperimento.

Unknown ha detto...

@Chiara Grazie... in effetti non ho trovato dati sul reale utilizzo dei suggerimenti, ma concordo con te che la questione sia quantomento da tenere d'occhio ;-)

@Marco Ziero in realtà pero' i siti che avevano creato l'abbinamento sgradito del mio caso specifico erano siti assolutamente di "infima" categoria ! :-) niente hub ne trust di sorta!

@ Tambu Grazie!

@ Piersimoni ...non ti riferirai mica a Prandelli alla Juve?!! :-D piu' che "google suggest" quello è "google Dreaming" .. se lo sognano!

marco ha detto...

@Nicola

Questo, quindi, mette un'ombra sul secondo aspetto, almeno da un punto di vista qualitativo.

Si tratta di un approccio quindi quantitativo? Keyword stuffing? Mmm... :(

Da osservare... ;)

Andrea Vit ha detto...

Complimenti per lo spunto Nicola: molto interessante la tua analisi sui fattori per la scelta di Google suggest.
Credo che i due fattori da te indicati, siano ulteriormente 'sporcati' con peso più o meno rilevante anche da fattore temporali relativi al documento (Google si sta muovendo molto su questo fronte).
Spesso, quindi, in Google Suggest puoi trovare query suggerite molto 'calde' probabilmente indotte dall'indicizzazione di una massa di nuovi documenti semanticamente simili, confermato poi dal numero di ricerche degli utenti (che confermerebbe l'interesse su determinate query).

fradefra ha detto...

Ottimo post.
Qualche dubbio, invece, sull'intervento. O meglio, hai fatto, secondo me, ciò che c'era da fare, ma io la segnalazione l'avrei fatta lo stesso.

Infatti dovrebbe esser nostro interesse che Google migliori questo servizio ed ovviamente non può farlo se noi non segnaliamo gli errori.

Vabbè, magari alla prossima :)

Comunque, grazie per la condivisione, veramente interessante :)

...soprattutto per noi che di CS ne facciamo a pacchi per i nostri clienti :)

Andrea Chiga ha detto...

Ciao Nicola,
ti segnalo questo articolo:

9 (Stupid) Examples Why Google Search Is Better Than Yahoo!

http://www.maxim.com/humor/stupid-fun/84573/9-reasons-why-google-search-suggest-is-better-than-yahoo.html

Unknown ha detto...

Ciao Nicola, grazie per questo contributo illuminante. In effetti sembra molto strano attribuire certe suggestions principalmente a un fattore di popolarita' della query.
Ma allora da quello che dici e' possibile che provando a "boostare" una reputazione per un brand, si finisca col ottenere risultati opposti, se poi i termini positivi verrano comunque associati a quelli negativi da google?