Opinion Mining & Big Data je program koji Teamnet realizuje u saradnji sa Fakultetom za automatizaciju i informatiku, Univerziteta “Politehnica” u Bukureštu.
Za studente koji žele da budu u stanju da precizno detektuju sva mišljenja izražena u tekstovima i raspravama, pokrenuli smo program akademskog istraživanja za široko poboljšanje i razvoj alata koji se trenutno koriste.
Zadali smo sebi zadatak da pokrenemo i druge teme vezane za analizu velike količine podataka i tekstova generisanih danas, primenom tehnika kao što su automatsko učenje, pronalaženje informacija, analiza socijalnih mreža i intuitivno modeliranje.
Opinion Mining & Big Data je program namenjen studentima i studentima na Master studijama Fakulteta za automatizaciju i informatiku, Fakulteta za matematiku i informatiku itd. Rezultati dobijeni na osnovu istraživanja korišćeni su kod sačinjavanja njihovih diplomskih radova.
U ovom trenutku imamo tri glavna pravca razvoja aplikacije:
- Automatsko praćenje: otkrivanje pomenutih entiteta, mišljenja i citata iz tekstova na rumunskom jeziku;
- Analiza javnih podataka za posebne projekte:
- Izgradnja grafikona biznismena u Rumuniji;
- Analiza javnih tendera u Rumuniji;
- Izgradnja konverzacijskih agenata koji će modelirati istorijsku, naučnu ili književnu ličnost.
Kao stažista u okviru projekta Opinion Mining & Big Data, uspećete da razvijete svoje poslovne veštine i to:
- Učenje algoritama i tehnika specifičnih za oblast stažiranja;
- Rad na razvoju softver aplikacije koja će uključiti algoritme predložene za rešavanje problema;
- Rad na testiranju i validaciji rezultata razvijene aplikacije;
- Rad na integrisanju i unapređenju postojeće platforme za prikupljanje podataka i otkrivanju mišljenja onlajn u tekstovima napisanim na rumunskom jeziku (koja koristi tehnologiju open-source kao Apache olr, Apache Nutch, Weka, Mallet, itd.);
- Stimulisanje kritičkog mišljenja, radeći na razvoju sopstvenih ideja poboljšanjem ili kombinovanjem iše različitih postojećih metoda rešavanja.
U okviru predloženih istraživačkih tema, koristi se veliki asortiman specifičnih tehnologija iz sledećih oblasti:
- Natural Language Processing: lematizacija, POS označavanje, afektivni rezultati, stablo međuzavisnosti, n-gram modeli itd.
- Povrat informacija: Apache Nutch & Lucene & Solr;
- Učenje mašina: Weka, Mallet, clustering (STC, Lingo);
- Baze podataka NoSQL; MongoDB, Neo4j.
Pored toga, tokom celog perioda stažiranja koristićete sponzorstvo s naše strane.
Da bi se moglo ući u program, moraju se proći sledeće faze:
- Slanje aplikacije;
- Obavljanje razgovora sa našim HR timom;
- Polaganje logičnog i tehničkog testa;
- Obavljanje razgovora sa stručnjakom u relevantnoj oblasti;
- Integrisanje u okviru tima.
Ako želite da aplicirate za neku poziciju u ovom programu, morate posedovati :
- Dobro poznavanje Java (4C i Python predstavlja plus)
- Dobro poznavnje strukture podataka i algoritama;
- Želju za naučnim dokazivanjem u novoj oblasti i učenjem postojećih open-source programa u oblasti.
Smatra se kao plus:
- Poznavanje osnovnih pojmova text mining, information retrieval ili machine learning;
- Učešće u open-source projektima ili drugim softverskim projektima razvijenim u timu (na primer, na fakultetu)
Period 2013-2014
- 7 studenata je učestvovalo u letnjim stažiranjima;
- 6 stažista je radilo i na diplomskom radu u okviru kompanije;
- 4 studenta su nastavila saradnju sa zaposlenima puno radno vreme.
Period 2012-2013
- 8 studenata je učestvovalo u letnjim stažiranjima;
- 7 studenata je realizovalo i diplomski rad u okviru kompanije;
- 4 studenta su se zaposlila sa punim radnim vremenom, po završetku studija.