Opinion Mining & Big Data

Programe academice

Opinion Mining & Big Data je program koji Teamnet realizuje u saradnji sa Fakultetom za automatizaciju i informatiku, Univerziteta “Politehnica” u Bukureštu.

Za studente koji žele da budu u stanju da precizno detektuju sva mišljenja izražena u tekstovima i raspravama, pokrenuli smo program akademskog istraživanja za široko poboljšanje i razvoj alata koji se trenutno koriste.

Zadali smo sebi zadatak da pokrenemo i druge teme vezane za analizu velike količine podataka i tekstova generisanih danas, primenom tehnika kao što su automatsko učenje, pronalaženje informacija, analiza socijalnih mreža i intuitivno modeliranje.

Opinion Mining & Big Data je program namenjen studentima i studentima na Master studijama Fakulteta za automatizaciju i informatiku, Fakulteta za matematiku i informatiku itd. Rezultati dobijeni na osnovu istraživanja korišćeni su kod sačinjavanja njihovih diplomskih radova.

U ovom trenutku imamo tri glavna pravca razvoja aplikacije:

 • Automatsko praćenje: otkrivanje pomenutih entiteta, mišljenja i citata iz tekstova na rumunskom jeziku;
 • Analiza javnih podataka za posebne projekte:
  • Izgradnja grafikona biznismena u Rumuniji;
  • Analiza javnih tendera u Rumuniji;
 • Izgradnja konverzacijskih agenata koji će modelirati istorijsku, naučnu ili književnu ličnost.

 

Kao stažista u okviru projekta Opinion Mining & Big Data, uspećete da razvijete svoje poslovne veštine i to:

 • Učenje algoritama i tehnika specifičnih za oblast stažiranja;
 • Rad na razvoju softver aplikacije koja će uključiti algoritme predložene za rešavanje problema;
 • Rad na testiranju i validaciji rezultata razvijene aplikacije;
 • Rad na integrisanju i unapređenju postojeće platforme za prikupljanje podataka i otkrivanju mišljenja onlajn u tekstovima napisanim na rumunskom jeziku (koja koristi tehnologiju open-source kao Apache olr, Apache Nutch, Weka,  Mallet, itd.);
 • Stimulisanje kritičkog mišljenja, radeći na razvoju sopstvenih ideja poboljšanjem ili kombinovanjem iše različitih postojećih metoda rešavanja.

U okviru predloženih istraživačkih tema, koristi se veliki asortiman specifičnih tehnologija iz sledećih oblasti:

 • Natural Language Processing: lematizacija, POS označavanje, afektivni rezultati, stablo međuzavisnosti, n-gram modeli itd.
 • Povrat informacija: Apache Nutch & Lucene & Solr;
 • Učenje mašina: Weka, Mallet, clustering (STC, Lingo);
 • Baze podataka NoSQL; MongoDB, Neo4j.

Pored toga, tokom celog perioda stažiranja koristićete sponzorstvo s naše strane.

Da bi se moglo ući u program, moraju se proći sledeće faze:

 • Slanje aplikacije;
 • Obavljanje razgovora sa našim HR timom;
 • Polaganje logičnog i tehničkog testa;
 • Obavljanje razgovora sa stručnjakom u relevantnoj oblasti;
 • Integrisanje u okviru tima.

 

Ako želite da aplicirate za neku poziciju u ovom programu, morate posedovati :

 • Dobro poznavanje Java (4C i Python predstavlja plus)
 • Dobro poznavnje strukture podataka i algoritama;
 • Želju za naučnim dokazivanjem u novoj oblasti  i učenjem postojećih open-source programa u oblasti.

Smatra se kao plus:

 • Poznavanje osnovnih pojmova text mining, information retrieval ili machine learning;
 • Učešće u open-source projektima ili drugim softverskim projektima razvijenim u timu (na primer, na fakultetu)

Period 2013-2014

 • 7 studenata je učestvovalo u letnjim stažiranjima;
 • 6 stažista je radilo i na diplomskom radu u okviru kompanije;
 • 4 studenta su nastavila saradnju sa zaposlenima puno radno vreme.

Period 2012-2013

 • 8 studenata je učestvovalo u letnjim stažiranjima;
 • 7 studenata je realizovalo i diplomski rad u okviru kompanije;
 • 4 studenta su se zaposlila sa punim radnim vremenom, po završetku studija.