Opinion Mining & Big Data
Opinion Mining & Big Data je program u partnerstvu sa Univerzitetom koji razvija aplikacije za složene obrade velikih tekstova i ostalih podataka u različitim formatima. Program je namenjen studentima i studentima na Master studijama Fakulteta za automatizaciju i informatiku, Fakulteta za matematiku i informatiku, kao i studentima drugih fakulteta, zainteresovanih za predložene istraživačke teme. Rezultati dobijeni u okviru programa su u stvari rezultati njihovih diplomskih radova i disertacija.
Glavne istraživačke teme vezane su za izvlačenje mišljenja iz tekstova na rumunskom jeziku, automatsku detekciju izjava i saopštenja datih od pojedinaca ili kompanija, kao i za obradu javnih podataka izdatih od centralnih ili lokalnih organa vlasti (na primer, podaci iz Službenog lista, podaci o javnim nabavkama kao i drugi raspoloživi podaci na platformi www.data.gov.ro).
U okviru predloženih istraživačkih tema, koristi se veliki asortiman specifičnih tehnologija iz sledećih oblasti:
- Natural Language Processing: lematizacija, POS označavanje, afektivni rezultati, stablo međuzavisnosti, n-gram modeli itd.
- Povrat informacija: Apache Nutch & Lucene & Solr;
- Učenje mašina: Weka, Mallet, clustering (STC, Lingo);
- Baze podataka NoSQL; MongoDB, Neo4j.
Publikacije na teme programa:
Florea, I.M., Rebedea, T., Chiru, C.G. Parser de dependenţe pentru limba română realizat pe baza parserelor pentru alte limbi romanice. Revista Română de Interacţiune Om-Calculator ( Parser zavisnosti rumunskog jezika realizovanog na osnovu parsera ostalih romanskih jezika. Rumunski časopis interakcije Čovek-Računar) 7(1), 1-20, 2014.
Zamfirescu, A.N., Rebedea, T.E. Identificarea entităţilor, citatelor şi evenimentelor în ştiri şi texte din Web-ul social în limba română. Revista Romana de Interactiune Om-Calculator (Identifikacija entiteta, citata i događaja u vestima i tekstovima na društvenom Web sajtu na rumunskom jeziku. Rumunski časopis interakcije Čovek-Računar) 6(2), 169-192, 2013.
U ovom trenutku imamo tri glavna pravca razvoja aplikacija:
- Automatsko praćenje: otkrivanje pomenutih entiteta, mišljenja i citata iz tekstova na rumunskom jeziku;
- Analiza javnih podataka za posebne projekte:
- Izgradnja grafikona biznismena u Rumuniji;
- Analiza javnih tendera u Rumunij
- Izgradnja konverzacijskih agenata koji će modelirati istorijsku, naučnu ili književnu ličnost.
- Teamnet
- Univerzitet “Politehnica” u Bukureštu – Fakultet za automatizaciju i informatiku