En un mar de pensamientos inconexos, incoherentes e incluso mal escritos como es Twitter, comprenderás que desarrollar dicho algoritmo no ha sido nada sencillo.
En primer lugar, los investigadores recopilaron 11.000 tuits con etiquetas geográficas de dos zonas: Nueva York y Monroe.
Filtraron aquellas que contenían «borracho», «cerveza» y otras palabras relacionadas con el arte de empinar el codo.
Tomaron toda esta información y analizaron detenidamente si la persona que enviaba los tuits estaba hablando de licores o realmente estaba bebiendo mientras escribía.
Es más, el equipo fue capaz de desarrollar un método para determinar si estaban bebiendo en casa o en otro lugar con un nivel de aciertos del 80%.
Esta metodología no es perfecta pero sí es mucho más rápida y amena que otros métodos de investigación. El objetivo final de esta era estudiar el cambio en la actitud de las personas que beben según su edad, sexo y origen étnico.