Opinion Mining & Big Data

Početna Karijere Akademski programi Opinion Mining & Big Data

Opinion Mining & Big Data je program koji Teamnet realizuje u saradnji sa Fakultetom za automatizaciju i informatiku, Univerziteta “Politehnica” u Bukureštu.

Za studente koji žele da budu u stanju da precizno detektuju sva mišljenja izražena u tekstovima i raspravama, pokrenuli smo program akademskog istraživanja za široko poboljšanje i razvoj alata koji se trenutno koriste.

Zadali smo sebi zadatak da pokrenemo i druge teme vezane za analizu velike količine podataka i tekstova generisanih danas, primenom tehnika kao što su automatsko učenje, pronalaženje informacija, analiza socijalnih mreža i intuitivno modeliranje.

Opinion Mining & Big Data je program namenjen studentima i studentima na Master studijama Fakulteta za automatizaciju i informatiku, Fakulteta za matematiku i informatiku itd. Rezultati dobijeni na osnovu istraživanja korišćeni su kod sačinjavanja njihovih diplomskih radova.

U ovom trenutku imamo tri glavna pravca razvoja aplikacije:

Automatsko praćenje: otkrivanje pomenutih entiteta, mišljenja i citata iz tekstova na rumunskom jeziku;
Analiza javnih podataka za posebne projekte:
- Izgradnja grafikona biznismena u Rumuniji;
- Analiza javnih tendera u Rumuniji;
Izgradnja konverzacijskih agenata koji će modelirati istorijsku, naučnu ili književnu ličnost.

Prednosti Faze prijema Zahtevi za apliciranje Rezultati

Kao stažista u okviru projekta Opinion Mining & Big Data, uspećete da razvijete svoje poslovne veštine i to:

Učenje algoritama i tehnika specifičnih za oblast stažiranja;
Rad na razvoju softver aplikacije koja će uključiti algoritme predložene za rešavanje problema;
Rad na testiranju i validaciji rezultata razvijene aplikacije;
Rad na integrisanju i unapređenju postojeće platforme za prikupljanje podataka i otkrivanju mišljenja onlajn u tekstovima napisanim na rumunskom jeziku (koja koristi tehnologiju open-source kao Apache olr, Apache Nutch, Weka, Mallet, itd.);
Stimulisanje kritičkog mišljenja, radeći na razvoju sopstvenih ideja poboljšanjem ili kombinovanjem iše različitih postojećih metoda rešavanja.

U okviru predloženih istraživačkih tema, koristi se veliki asortiman specifičnih tehnologija iz sledećih oblasti:

Natural Language Processing: lematizacija, POS označavanje, afektivni rezultati, stablo međuzavisnosti, n-gram modeli itd.
Povrat informacija: Apache Nutch & Lucene & Solr;
Učenje mašina: Weka, Mallet, clustering (STC, Lingo);
Baze podataka NoSQL; MongoDB, Neo4j.

Pored toga, tokom celog perioda stažiranja koristićete sponzorstvo s naše strane.

Da bi se moglo ući u program, moraju se proći sledeće faze:

Slanje aplikacije;
Obavljanje razgovora sa našim HR timom;
Polaganje logičnog i tehničkog testa;
Obavljanje razgovora sa stručnjakom u relevantnoj oblasti;
Integrisanje u okviru tima.

Ako želite da aplicirate za neku poziciju u ovom programu, morate posedovati :

Dobro poznavanje Java (4C i Python predstavlja plus)
Dobro poznavnje strukture podataka i algoritama;
Želju za naučnim dokazivanjem u novoj oblasti i učenjem postojećih open-source programa u oblasti.

Smatra se kao plus:

Poznavanje osnovnih pojmova text mining, information retrieval ili machine learning;
Učešće u open-source projektima ili drugim softverskim projektima razvijenim u timu (na primer, na fakultetu)

Period 2013-2014

7 studenata je učestvovalo u letnjim stažiranjima;
6 stažista je radilo i na diplomskom radu u okviru kompanije;
4 studenta su nastavila saradnju sa zaposlenima puno radno vreme.

Period 2012-2013

8 studenata je učestvovalo u letnjim stažiranjima;
7 studenata je realizovalo i diplomski rad u okviru kompanije;
4 studenta su se zaposlila sa punim radnim vremenom, po završetku studija.

Opinion Mining & Big Data

Istraživanje i razvoj

Kompetencije

Korporativna kultura

Teamnet u ciframa