Информационный портал профессоров РАН

Мы в

Наверх

Живой клубок ДНК

июня 13, 2017

Лекция профессора РАН Шидловского Юлия Валерьевич, заместителя директора Института биологии гена РАН, доктора биологических наук на Фестивале науки в 2016 году

Подробнее

Вселенные на кончике пера

апреля 11, 2017

Член-корреспондент РАН профессор РАН Дмитрий Горбунов принял участие в передаче "Большая наука. На грани безумия" на канале ОТР.

Подробнее

Си вместо Трампа: станет ли Китай новым флагманом глобализации?

апреля 11, 2017

Профессор РАН Александр Ломанов принял участие в открытой лекции, которая состоялась в Культурном центре ЗИЛ.

Подробнее

Николай Гринцер: Греческая литература и наука родились из попыток рационализировать мифы

марта 29, 2017

Для чего современному человеку нужны древнегреческие трагедии и латинские стихи? Профессор РАН Николай Гринцер принял участие в программе "Гамбургский счет" на канале ОТР

Подробнее

Выступление профессора РАН Егора Плотникова в программе «Новые люди»

марта 29, 2017

Герой нового выпуска - Егор Плотников, ведущий научный сотрудник Института физико-химической биологии МГУ, расскажет об исследованиях, которые дадут надежду на выздоровление без преувеличения миллионам людей.

Подробнее

Анализ данных как область знания

Профессор РАН, математик Александр Дьяконов о задаче прогнозирования спроса, усложнении информации и анализе социальных сетей. Как на примере работы интернет-магазина разобрать примеры задач анализа данных? Как меняется эта область исследований? И какие задачи в анализе данных наиболее актуальны сегодня? 

Пока работает интернет-магазин, накапливаются данные. Мы сохраняем логи пользователей: кто и с каким IP заходил на наш сайт, что он делал, какие страницы и в какой последовательности смотрел, какие товары в итоге выбрал, мы сохраняем все складские движения и так далее. Когда у нас накопилось достаточно много информации, наша задача поддержания этого интернет-магазина в режиме эффективного функционирования фактически является задачей анализа данных, которая разбивается на много различных подзадач. Например, задача прогнозирования спроса, потому что каждый товар нам надо не просто покупать, а закупать в каком-то определенном количестве.

Что же такое «анализ данных»? У нас есть данные, и мы хотим извлечь из них полезные закономерности, которые можно использовать в дальнейшем, например, для повышения эффективности бизнес-процессов, для проведения исследований, планирования и так далее. У многих сразу возникает вопрос: если я смотрю на табличку с числами и пытаюсь найти закономерности, неужели я занимаюсь анализом данных? Честно говоря, да. Если кассир считает вам сдачу, то на вопрос «Занимается ли она математикой?» некоторые могут ответить, что нет, она думает не о гипотезе Римана. С другой стороны, она будет применять те знания, которые она получила в школьном курсе математики. Просто есть математика элементарная, и есть высшая; и в данном случае она занимается элементарной математикой. Так и анализ данных имеет различные градации. Иногда употребляют термин «интеллектуальный анализ данных», но, на мой взгляд, не стоит вводить такую усеченную терминологию, каждый раз из контекста понятно, о чем идет речь. В принципе, это вольный перевод термина data mining — «добыча данных».
Данные постоянно усложнялись. Если мы рассмотрим учебники по машинному обучению середины XX века, то там в основном все ориентировано на информацию, которая записана в вещественные таблички. Потом стали появляться задачи с классификацией текста, которые тоже сводили к задаче с вещественной матрицей. Потом появились специфические тексты, скажем html-документы, xml-файлы, jsn-файлы и так далее. Таким образом, каждый раз информация становилась все более и более сложнее. Более того, появились некоторые объекты, которые еще недавно не были центральными объектами в исследовании, а в 2014 году они представляют крайне важный интерес, например социальные сети. Раньше динамические гигантские графы фактически не исследовались, а появились социальные сети, и появился большой спектр задач, связанный с этим понятием.

Источник: https://postnauka.ru

Страница Александр Дьяконова на сайте "ПостНаука" https://postnauka.ru/author/djakonov