Cercetare și dezvoltare

Opinion Mining & Big Data Icon Opinion Mining & Big Data

Opinion Mining & Big Data este un parteneriat universitar care își propune să dezvolte aplicații care să facă procesări complexe asupra unor volume mari de texte, dar și de alte date în diverse formate. El se adresează studenţilor şi masteranzilor de la Facultatea de Automatică şi Calculatoare, Facultatea de Matematică și Informatică, precum și studenților din alte facultăți, interesați de temele de cercetare propuse. Rezultalele obţinute de aceștia  în cadrul programului sunt  de fapt rezultatele lucrărilor lor de diplomă sau dizertație.

Principalele teme de cercetare sunt legate de extragerea opiniilor din texte în limba română, detecția automată a declarațiilor și comunicatelor făcute de persoane sau companii, precum și prelucrarea datelor publice emise de către autoritățile centrale sau locale (de exemplu, date din Monitorul Oficial, date despre achizițiile publice, precum și alte date disponibile pe platforma www.data.gov.ro).

În cadrul temelor de cercetare propuse, se utilizează o gamă largă de tehnologii specifice următoarelor domenii:

  • Natural Language Processing: lematizare, POS tagging, scoruri afective, arbori de dependențe, modele de n-grame etc;
  • Information Retrieval: Apache Nutch & Lucene & Solr;
  • Machine Learning: Weka, Mallet, clustering (STC, Lingo);
  • Baze de date NoSQL: MongoDB, Neo4j.

Publicații pe teme din program:

În acest moment, avem trei direcții principale de dezvoltare de aplicații:

  • Monitorizare media automată: detecția entităților numite, a opiniilor și citatelor pentru texte în limba română
  • Analiza datelor publice pentru proiecte specifice:
    • Construirea grafului oamenilor de afaceri din România
    • Analiza licitațiilor publice din România
  • Construirea agenților conversaționali, care să modeleze o personalitate istorică, științifică sau literară.

 

  • Teamnet
  • Universitatea Politehnică din București – Facultatea de Automatică și Calculatoare