Istraživanje i razvoj

Opinion Mining & Big Data Icon Opinion Mining & Big Data

Opinion Mining & Big Data je program u partnerstvu sa Univerzitetom koji razvija aplikacije za složene obrade velikih tekstova i ostalih podataka u različitim formatima. Program je namenjen studentima i studentima na Master studijama Fakulteta za automatizaciju i informatiku, Fakulteta za matematiku i informatiku, kao i studentima drugih fakulteta, zainteresovanih za predložene istraživačke teme. Rezultati dobijeni u okviru programa su u stvari rezultati njihovih diplomskih radova i disertacija.

Glavne istraživačke teme vezane su za izvlačenje mišljenja iz tekstova na rumunskom jeziku, automatsku detekciju izjava i saopštenja datih od pojedinaca ili kompanija, kao i za obradu javnih podataka izdatih od centralnih ili lokalnih organa vlasti (na primer, podaci iz Službenog lista, podaci o javnim nabavkama kao i drugi raspoloživi podaci na platformi www.data.gov.ro).

U okviru predloženih istraživačkih tema, koristi se veliki asortiman specifičnih tehnologija iz sledećih oblasti:

  • Natural Language Processing: lematizacija, POS označavanje, afektivni rezultati, stablo međuzavisnosti, n-gram modeli itd.
  • Povrat informacija: Apache Nutch & Lucene & Solr;
  • Učenje mašina: Weka, Mallet, clustering (STC, Lingo);
  • Baze podataka NoSQL; MongoDB, Neo4j.

Publikacije na teme programa:

Florea, I.M., Rebedea, T., Chiru, C.G. Parser de dependenţe pentru limba română realizat pe baza parserelor pentru alte limbi romanice. Revista Română de Interacţiune Om-Calculator ( Parser zavisnosti rumunskog jezika realizovanog na osnovu parsera ostalih romanskih jezika. Rumunski časopis interakcije Čovek-Računar) 7(1), 1-20, 2014.
Zamfirescu, A.N., Rebedea, T.E. Identificarea entităţilor, citatelor şi evenimentelor în ştiri şi texte din Web-ul social în limba română. Revista Romana de Interactiune Om-Calculator (Identifikacija entiteta, citata i događaja u vestima i tekstovima na društvenom Web sajtu na rumunskom jeziku. Rumunski časopis interakcije Čovek-Računar) 6(2), 169-192, 2013.

U ovom trenutku imamo tri glavna pravca razvoja aplikacija:

  • Automatsko praćenje: otkrivanje pomenutih entiteta, mišljenja i citata iz tekstova na rumunskom jeziku;
  • Analiza javnih podataka za posebne projekte:
    • Izgradnja grafikona biznismena u Rumuniji;
    • Analiza javnih tendera u Rumunij
  • Izgradnja konverzacijskih agenata koji će modelirati istorijsku, naučnu ili književnu ličnost.
  • Teamnet
  • Univerzitet “Politehnica” u Bukureštu – Fakultet za automatizaciju i informatiku