Программа «Опрос мнений и объемные данные» проводится компанией Teamnet совместно с факультетом автоматического управления и информатики Политехнического университета Бухареста.
Мы запустили эту программу специально для студентов, которые хотят получить возможность точно отслеживать мнения, названия, цитаты в публикациях и сообщениях – для этих целей мы разработали ряд инструментов, позволяющих проводить поиск в большом количестве материалов.
В рамках данной программы мы также предложили ряд других тем, связанных с анализом больших объемов современных данных и текстов при помощи техник типа автоматическое изучение, поиск данных, анализ социальных сетей и прогнозное моделирование.
Программа «Опрос мнений и объемные данные» рассчитана на студентов факультета автоматического контроля и информатики, факультета математики и информатики и не только. Результаты исследований публикуются в форме дипломных работ и диссертаций на соискание степени магистра.
На данный момент приложения разрабатываются по трем основным направлениям:
- Автоматический мониторинг средств массовой информации: поиск упоминаний организаций, мнений, цитат в текстах на румынском языке.
- Анализ открытых данных для специальных проектов:
- Сводки о румынских бизнесменах;
- Анализ тендеров в Румынии;
- Выявление диалоговых элементов, составляющих историческую, научную или культурную характеристику.
Проект «Опрос мнений и объемные данные» позволяет развивать специальные навыки и знания практикантов, а именно:
- Изучение специальных алгоритмов и технологий;
- Работа над созданием информационных приложений с использованием нужных алгоритмов;
- Работа над тестированием и проверкой приложений;
- Работа над интеграцией и развитием существующих платформ сбора данных и поиска мнений в текстах на румынском языке (при помощи технологий открытого доступа – Apache Solr, Apache Nutch, Weka, Mallet, и др.);
- Развитие критического и творческого мышления, навык комбинирования существующих решений.
Для исследования предложенных тем был использован целый ряд специализированных технологий:
- Обработка текстов на естественных языках: лемматизация, маркировка, оценка эмотивного воздействия, дерево зависимости, модели n-gram и т.д.
- Информационный поиск: Apache Nutch & Lucene & Solr;
- Машинное обучение: Weka, Mallet, clustering (STC, Lingo);
- Базы данных NoSQL; MongoDB, Neo4j.
На протяжении программы, компания оказывает финансовую поддержку практикантам.
Для участия в программе Вам необходимо пройти несколько этапов:
- Отправить заявку;
- Прийти на собеседование с сотрудниками отдела кадров;
- Пройти тестирование на логику и технические знания;
- Прийти на собеседование со специалистом в выбранной сфере;
- Стать частью команды.
Желающие стать практикантами должны обладать следующими знаниями / навыками:
- Отличное знание платформы Java (C и Python дают Вам преимущество);
- Отличное знание структуры данных и алгоритмов;
- Желание расширить научные познания и исследовать специализированные программы открытого доступа;
Следующие знания и навыки обеспечат Вам преимущество:
- Знание основных концепций поиска информации и машинного анализа данных;
- Участие в проектах по разработке программного обеспечения открытого доступа и любых других информационных проектов (например, в университете);
Период 2013-2014 гг.
- 7 человек участвовали в летней практике;
- 6 практикантов одновременно работали над своими дипломными работами / диссертациями на соискание степени магистра;
- 4 студента продолжили работу в компании в качестве постоянных сотрудников.
Период 2012 -2013 гг.
- 8 человек участвовали в летней практике;
- 7 практикантов одновременно работали над своими дипломными работами / диссертациями на соискание степени магистра;
- 4 студентов были наняты на постоянной основе после выпуска;