Quando si studiano i dati a nostra disposizione ci sono delle domande che si imparano con l’esperienza. Domande che diventano naturale bagaglio di un buon Data Scientist. Tante di queste domande nascono da ricerche, progetti pregressi e incredibili presentazioni di casi di successo. L’effetto “Mangia, Prega, Ama” ho avuto il piacere di riscoprirlo lavorando alla seconda demo di Yamgu.
Immaginate di avere dei picchi di ricerca in diverse parti del pianeta a orari ben precisi. Il picco scema nel giro di uno o due giorni. Picchi simili si manifestano giorno dopo giorno, quasi sempre la sera, ma da luoghi diversi e con parole chiave diverse. Questi picchi, seppur partiti da paesi diversi, si concentrano, alle volte, sulle stesse parole chiave. Ripulire tutto il rumore per riuscire a tracciarne un paio era impresa ardua nel, tecnologicamente, lontano 2013. Ricondurre tutto a uno schema ha richiesto il porsi un bel po’ di domande di psicologia e sociologia.
Cosa poteva scatenare questi picchi, quasi tutti da mobile e tablet, e perché scomparivano per non tornare. Oggi la risposta l’avete già intuita, ma non era normale avere il secondo schermo. Era una delle novità dell’anno e agenzie come Gartner (2013) lo avevano inserito come uno dei trend dell’anno. La scoperta fu risalire al film che stava generando il picco della serata. Con la pubblicità del film di Julia Roberts, erano già iniziate le ricerche su Roma e Parigi. Durante la messa in onda il picco era evidente e in crescita. Alla fine del film, l’evento andava pian piano a ridimensionarsi.
Adesso tutte le agenzie pubblicitarie all’avanguardia monitorano radio, TV, social e canali streaming per anticipare le ricerche degli utenti. Così, magicamente, la ricerca di una vacanza a Roma trova pronti gli operatori del settore con pacchetti dedicati fin nel minimo particolare. I software di gestione di voli e alberghi, allo stesso modo, riadattano i prezzi per la maggiore richiesta.
In ogni studio, occorre trovare il dato che non abbiamo, l’anello mancante tra i nostri dati e l’evento che li ha creati. Qualche anno dopo, nel 2017, chi ha vinto la competizione su Kaggle per ottimizzare il prezzo delle corse dei taxi di New York aveva avuto un’intuizione: unire i dati messi a disposizione con quelli delle partenze e degli arrivi degli aeroporti, per poi proseguire con i concerti e gli eventi sportivi.
Il lavoro di Data Scientist non è soltanto formule e codice, occorre una buona dose di curiosità e avere qualche nozione di tantissime altre scienze. Per esempio, le basi di sociologia, psicologia, storia, filosofia, etica, economia e politica non fanno mai male. Non serve essere un tuttologo, ma sapere cosa non sappiamo avendo le basi per poter chiedere alle persone giuste, parlando la stessa lingua.
L’effetto “Mangia, Prega, Ama” era già stato ipotizzato, prima, e osservato, poi, in altri ambienti, ma nel 2013 era possibile anticiparlo con un laptop, una GPU, uno scraper e le API di Twitter.
References:
Gartner. (2013, March 4). Market trends: Second screen users will drive social TV activities. Gartner. https://www.gartner.com/en/documents/2357015