Analiza mišljenja i veliki podaci
Analiza mišljenja i velikih podataka partnerstvo je sa sveučilištem kojim se nastoje razviti aplikacije za složenu obradu velikih tekstova i drugih oblika podataka. Namijenjen je dodiplomskim i diplomskim studentima Fakulteta automatike i računarstva, Fakulteta Matematike i Informatike, kao i studentima koji pohađaju druge fakultete, a zainteresirani su za predložene istraživačke teme. Rezultati dobiveni tijekom programa su u stvari ocjene dodijeljene studentima za njihove diplomske i magistarske radove.
Glavne teme istraživanja povezane su s izvlačenjem mišljenja iz rumunjskih tekstova, automatskim otkrivanjem izjava i objava za javnost pojedinaca ili tvrtki, kao i obrada javnih podataka koje izdaje središnja ili lokalna uprava (npr. podaci iz Službenog lista, podaci o javnoj nabavi i ostali podaci dostupni na platformi www.data.gov.ro).
U predloženim istraživačkim temama koristi se čitav niz tehnologija specifičnih za sljedeća područja:
- Obrada prirodnih jezika: lematizacija, POS označavanje, afektivni rezultati, stabla ovisnosti, n-gram modeli itd.
- Dobivanje informacija: Apache Nutch & Lucene & Solr;
- Strojno učenje: Weka, Mallet, clustering (STC, Lingo);
- NoSQL Database; MongoDB, Neo4j.
Publikacije usredotočene na teme ovog programa:
- Florea, I.M., Rebedea, T., Chiru, C.G. Parser de dependenţe pentru limba română realizat pe baza parserelor pentru alte limbi romanice/ Raščlanjivač ovisnosti za rumunjski jezik baziran na raščlanjivačima za druge romanske jezike. Revista Romana de Interactiune Om-Calculator/ Rumunjski časopis za interakciju čovjeka i računala 7(1), 1-20, 2014. (http://rochi.utcluj.ro/rrioc/articole/RRIOC-7-1-Florea.pdf)
- Zamfirescu, A.N., Rebedea, T.E. Identificarea entităţilor, citatelor şi evenimentelor în ştiri şi texte din Web-ul social în limba română./ Identifikacija cjelina, citata i događaja u vijestima i tekstovima sa društvenog weba. Revista Romana de Interactiune Om-Calculator/ Rumunjski časopis za interakciju čovjeka i računala 6(2), 169-192, 2013. (http://rochi.utcluj.ro/rrioc/articole/RRIOC-6-2-Zamfirescu.pdf)
Trenutno imamo tri glavna smjera za razvoj aplikacija:
- Automatizirano nadgledanje medija: detekcija spomenutih cjelina, mišljenja i citata za tekstove na rumunjskom jeziku
- Analiza javnih podataka za specifične projekte:
- Izrada grafikona rumunjskih poslovnih ljudi
- Analiza ponuda u Rumunjskoj
- Izgradnja konverzacijskih agenata koji bi trebali modelirati povijesnu, znanstvenu ili književnu ličnost
- Teamnet
- Sveučilište “Politehnica” u Bukureštu – Fakultet automatike i računarstva