Istraživanje i razvoj

Analiza mišljenja i veliki podaci Icon Analiza mišljenja i veliki podaci

Analiza mišljenja i velikih podataka partnerstvo je sa sveučilištem kojim se nastoje razviti aplikacije za složenu obradu velikih tekstova i drugih oblika podataka. Namijenjen je dodiplomskim i diplomskim studentima Fakulteta automatike i računarstva, Fakulteta Matematike i Informatike, kao i studentima koji pohađaju druge fakultete, a zainteresirani su za predložene istraživačke teme. Rezultati dobiveni tijekom programa su u stvari ocjene dodijeljene  studentima za njihove diplomske i magistarske radove.

Glavne teme istraživanja povezane su s izvlačenjem mišljenja iz rumunjskih tekstova, automatskim otkrivanjem izjava i objava za javnost pojedinaca ili tvrtki, kao i obrada javnih podataka koje izdaje središnja ili lokalna uprava (npr. podaci iz Službenog lista, podaci o javnoj nabavi i ostali podaci dostupni na platformi www.data.gov.ro).

U predloženim istraživačkim temama koristi se čitav niz tehnologija specifičnih za sljedeća područja:

  • Obrada prirodnih jezika: lematizacija, POS označavanje, afektivni rezultati, stabla ovisnosti, n-gram modeli itd.
  • Dobivanje informacija: Apache Nutch & Lucene & Solr;
  • Strojno učenje: Weka, Mallet, clustering (STC, Lingo);
  • NoSQL Database; MongoDB, Neo4j.

Publikacije usredotočene na teme ovog programa:

  • Florea, I.M., Rebedea, T., Chiru, C.G. Parser de dependenţe pentru limba română realizat pe baza parserelor pentru alte limbi romanice/ Raščlanjivač ovisnosti za rumunjski jezik baziran na raščlanjivačima za druge romanske jezike. Revista Romana de Interactiune Om-Calculator/ Rumunjski časopis za interakciju čovjeka i računala 7(1), 1-20, 2014. (http://rochi.utcluj.ro/rrioc/articole/RRIOC-7-1-Florea.pdf)
  • Zamfirescu, A.N., Rebedea, T.E. Identificarea entităţilor, citatelor şi evenimentelor în ştiri şi  texte din Web-ul social în limba română./ Identifikacija cjelina, citata i događaja u vijestima i tekstovima sa društvenog weba. Revista Romana de Interactiune Om-Calculator/ Rumunjski časopis za interakciju čovjeka i računala 6(2), 169-192, 2013. (http://rochi.utcluj.ro/rrioc/articole/RRIOC-6-2-Zamfirescu.pdf)

Trenutno imamo tri glavna smjera za razvoj aplikacija:

  • Automatizirano nadgledanje medija: detekcija spomenutih cjelina, mišljenja i citata za tekstove na rumunjskom jeziku
  • Analiza javnih podataka za specifične projekte:
    • Izrada grafikona rumunjskih poslovnih ljudi
    • Analiza ponuda u Rumunjskoj
  • Izgradnja konverzacijskih agenata koji bi trebali modelirati povijesnu, znanstvenu ili književnu ličnost
  • Teamnet
  • Sveučilište “Politehnica” u Bukureštu – Fakultet automatike i računarstva