Опрос мнений & Объемные данные

Programe academice

Программа «Опрос мнений и объемные данные» проводится компанией Teamnet совместно с факультетом автоматического управления и информатики Политехнического университета Бухареста. 

Мы запустили эту программу специально для студентов, которые хотят получить возможность точно отслеживать мнения, названия, цитаты в публикациях и сообщениях – для этих целей мы разработали ряд инструментов, позволяющих проводить поиск в большом количестве материалов.

В рамках данной программы мы также предложили ряд других тем, связанных с анализом больших объемов современных данных и текстов при помощи техник типа автоматическое изучение, поиск данных, анализ социальных сетей и прогнозное моделирование.

Программа «Опрос мнений и объемные данные» рассчитана на студентов факультета автоматического контроля и информатики, факультета математики и информатики и  не только.  Результаты исследований публикуются в форме дипломных работ и диссертаций на соискание степени магистра.

На данный момент приложения разрабатываются по трем основным направлениям:

  • Автоматический мониторинг средств массовой информации: поиск упоминаний организаций, мнений, цитат в текстах на румынском языке.
  • Анализ открытых данных для специальных проектов:
    • Сводки о румынских бизнесменах;
    • Анализ тендеров в Румынии;
  • Выявление диалоговых элементов, составляющих историческую, научную или культурную характеристику.

Проект «Опрос мнений и объемные данные» позволяет развивать специальные навыки и знания практикантов, а именно:

  • Изучение специальных алгоритмов и технологий;
  • Работа над созданием информационных приложений с использованием нужных алгоритмов;
  • Работа над тестированием и проверкой приложений;
  • Работа над интеграцией и развитием существующих платформ сбора данных и поиска мнений в текстах на румынском языке (при помощи технологий открытого доступа – Apache Solr, Apache Nutch, Weka, Mallet, и др.);
  • Развитие критического и творческого мышления, навык комбинирования существующих решений.

Для исследования предложенных тем был использован целый ряд специализированных технологий:

  • Обработка текстов на естественных языках: лемматизация, маркировка, оценка эмотивного воздействия, дерево зависимости,  модели n-gram и т.д.
  • Информационный поиск: Apache Nutch & Lucene & Solr;
  • Машинное обучение: Weka, Mallet, clustering (STC, Lingo);
  • Базы данных NoSQL; MongoDB, Neo4j.

На протяжении программы, компания оказывает финансовую поддержку практикантам.

Для участия в программе Вам необходимо пройти несколько этапов:

  • Отправить заявку;
  • Прийти на собеседование с сотрудниками отдела кадров;
  • Пройти тестирование на логику и технические знания;
  • Прийти на собеседование со специалистом в выбранной сфере;
  • Стать частью команды.

Желающие стать практикантами должны обладать следующими знаниями / навыками:

  • Отличное знание  платформы Java (C и Python дают Вам преимущество);
  • Отличное знание  структуры данных и алгоритмов;
  • Желание расширить научные познания и исследовать специализированные программы открытого доступа;

Следующие знания и навыки обеспечат Вам преимущество:

  • Знание основных концепций поиска информации и машинного анализа данных;
  • Участие в проектах по разработке программного обеспечения открытого доступа и любых других информационных проектов (например, в университете);

Период 2013-2014 гг.

  • 7  человек участвовали в летней практике;
  • 6 практикантов одновременно работали над своими дипломными работами / диссертациями на соискание степени магистра;
  • 4 студента продолжили работу в компании в качестве постоянных сотрудников.

Период 2012 -2013 гг.

  • 8 человек участвовали в летней практике;
  • 7 практикантов одновременно работали над своими дипломными работами / диссертациями на соискание степени магистра;
  • 4 студентов были наняты на постоянной основе после выпуска;