Opinion Mining & Big Data

Programe academice

Opinion Mining & Big Data je program koji Teamnet realizuje u saradnji sa Fakultetom za automatizaciju i informatiku, Univerziteta “Politehnica” u Bukureštu.

Za studente koji žele da budu u stanju da precizno detektuju sva mišljenja izražena u tekstovima i raspravama, pokrenuli smo program akademskog istraživanja za široko poboljšanje i razvoj alata koji se trenutno koriste.

Zadali smo sebi zadatak da pokrenemo i druge teme vezane za analizu velike količine podataka i tekstova generisanih danas, primenom tehnika kao što su automatsko učenje, pronalaženje informacija, analiza socijalnih mreža i intuitivno modeliranje.

Opinion Mining & Big Data je program namenjen studentima i studentima na Master studijama Fakulteta za automatizaciju i informatiku, Fakulteta za matematiku i informatiku itd. Rezultati dobijeni na osnovu istraživanja korišćeni su kod sačinjavanja njihovih diplomskih radova.

U ovom trenutku imamo tri glavna pravca razvoja aplikacije:

  • Automatsko praćenje: otkrivanje pomenutih entiteta, mišljenja i citata iz tekstova na rumunskom jeziku;
  • Analiza javnih podataka za posebne projekte:
    • Izgradnja grafikona biznismena u Rumuniji;
    • Analiza javnih tendera u Rumuniji;
  • Izgradnja konverzacijskih agenata koji će modelirati istorijsku, naučnu ili književnu ličnost.

 

Kao stažista u okviru projekta Opinion Mining & Big Data, uspećete da razvijete svoje poslovne veštine i to:

  • Učenje algoritama i tehnika specifičnih za oblast stažiranja;
  • Rad na razvoju softver aplikacije koja će uključiti algoritme predložene za rešavanje problema;
  • Rad na testiranju i validaciji rezultata razvijene aplikacije;
  • Rad na integrisanju i unapređenju postojeće platforme za prikupljanje podataka i otkrivanju mišljenja onlajn u tekstovima napisanim na rumunskom jeziku (koja koristi tehnologiju open-source kao Apache olr, Apache Nutch, Weka,  Mallet, itd.);
  • Stimulisanje kritičkog mišljenja, radeći na razvoju sopstvenih ideja poboljšanjem ili kombinovanjem iše različitih postojećih metoda rešavanja.

U okviru predloženih istraživačkih tema, koristi se veliki asortiman specifičnih tehnologija iz sledećih oblasti:

  • Natural Language Processing: lematizacija, POS označavanje, afektivni rezultati, stablo međuzavisnosti, n-gram modeli itd.
  • Povrat informacija: Apache Nutch & Lucene & Solr;
  • Učenje mašina: Weka, Mallet, clustering (STC, Lingo);
  • Baze podataka NoSQL; MongoDB, Neo4j.

Pored toga, tokom celog perioda stažiranja koristićete sponzorstvo s naše strane.

Da bi se moglo ući u program, moraju se proći sledeće faze:

  • Slanje aplikacije;
  • Obavljanje razgovora sa našim HR timom;
  • Polaganje logičnog i tehničkog testa;
  • Obavljanje razgovora sa stručnjakom u relevantnoj oblasti;
  • Integrisanje u okviru tima.

 

Ako želite da aplicirate za neku poziciju u ovom programu, morate posedovati :

  • Dobro poznavanje Java (4C i Python predstavlja plus)
  • Dobro poznavnje strukture podataka i algoritama;
  • Želju za naučnim dokazivanjem u novoj oblasti  i učenjem postojećih open-source programa u oblasti.

Smatra se kao plus:

  • Poznavanje osnovnih pojmova text mining, information retrieval ili machine learning;
  • Učešće u open-source projektima ili drugim softverskim projektima razvijenim u timu (na primer, na fakultetu)

Period 2013-2014

  • 7 studenata je učestvovalo u letnjim stažiranjima;
  • 6 stažista je radilo i na diplomskom radu u okviru kompanije;
  • 4 studenta su nastavila saradnju sa zaposlenima puno radno vreme.

Period 2012-2013

  • 8 studenata je učestvovalo u letnjim stažiranjima;
  • 7 studenata je realizovalo i diplomski rad u okviru kompanije;
  • 4 studenta su se zaposlila sa punim radnim vremenom, po završetku studija.