Pe site-ul tweetgenie.nl, lansat luni, 13 mai, este suficientă introducerea numelui utilizatorului pentru a-i evalua vârsta şi sexul. Cercetătorii au analizat aproape 3.000 de conturi Twitter, cu utilizatori identificaţi. Au stabilit apoi liste de cuvinte sau sintagme ce apar frecvent la internauţii dintr-un anumit segment de vârstă sau aparţinând unui anumit sex, arată Dong Nguyen, doctorand în informatică la Universitatea din Twente, care a participat la proiect. Ea a precizat că a fost luat în considerare doar conţinutul mesajelor şi nu, de exemplu, imaginea profilului, potrivit Agerpres.
Pentru a ghici vârsta şi sexul, programul analizează ultimele 200 de mesaje ale utilizatorului şi le compară cu baza de date stabilită de creatorii site-ului. ‘Sunt foarte clare lucrurile care îi diferenţiază pe bărbaţi de femei’, afirmă dna Nguyen. De exemplu, bărbaţii folosesc mai des cuvintele ‘fotbal’ şi ‘bere’, iar femeile, ‘unghii’ şi ‘hihi’, arată site-ul. În ceea ce priveşte vârsta, tinerii vorbesc mai des despre ei înşişi şi recurg la multe emoticoane, în timp ce persoanele mai mature utilizează cuvinte şi fraze mai lungi’, adaugă ea.
Programul are o marjă de eroare medie de patru ani, fiind mult mai precis în privinţa tinerilor decât a persoanelor mai mature, precizează creatorii lui. ‘Am observat că limbajul utilizatorilor este mai uniform de la 35 de ani’, susţine Dong Nguyen. ‘De exemplu, există mai multe diferenţe între un utilizator de 15 ani şi unul de 20 decât între un utilizator de 45 de ani şi unul de 55’, precizează ea.
Cine doreşte să i se ghicească vârsta şi sexul mai are totuşi de aşteptat fiindcă programul analizează deocamdată numai mesajele scurte în olandeză. Dong Nguyen afirmă că echipa de cercetători vrea să adapteze softul la alte limbi şi alte reţele de socializare, ca de exemplu Facebook.