Информационный портал профессоров РАН

Мы в

Наверх

Моторная активность облегчает принятие решения

июля 16, 2018

Выступление профессора РАН Дьяконовой Варвары на Седьмой международной конференции по когнитивной науке

Подробнее

Право голоса

июня 28, 2018

Профессор РАН Олег Барабанов принял участие в передаче "Право голоса".

Подробнее

Биологические молекулярные машины

июня 6, 2018

Что такое супрамолекулярная химия и чем она отличается от молекулярной химии? Как работают биологические молекулярные машины? На эти и другие увлекательные темы по химии поговорила с московскими школьниками член-корреспондент Российской академии...

Подробнее

НАУКА И ИСКУССТВО. Профессор РАН Бобровский об искусстве

июня 3, 2018

У каждого учёного есть сверх идея - вносить свой посильный вклад в процесс познания мира. И отправной точкой, запустившей этот процесс, становятся детские переживания, связанные с прикосновением к произведениям искусства...

Подробнее

Алексей Собисевич, член-корреспондент РАН, о природных катаклизмах. Молния

октября 19, 2017

Интервью с Алексеем Собисевичем об изменении климата, природных катаклизмах и сейсмической активности 

Подробнее

Анализ данных как область знания

Профессор РАН, математик Александр Дьяконов о задаче прогнозирования спроса, усложнении информации и анализе социальных сетей. Как на примере работы интернет-магазина разобрать примеры задач анализа данных? Как меняется эта область исследований? И какие задачи в анализе данных наиболее актуальны сегодня? 

Пока работает интернет-магазин, накапливаются данные. Мы сохраняем логи пользователей: кто и с каким IP заходил на наш сайт, что он делал, какие страницы и в какой последовательности смотрел, какие товары в итоге выбрал, мы сохраняем все складские движения и так далее. Когда у нас накопилось достаточно много информации, наша задача поддержания этого интернет-магазина в режиме эффективного функционирования фактически является задачей анализа данных, которая разбивается на много различных подзадач. Например, задача прогнозирования спроса, потому что каждый товар нам надо не просто покупать, а закупать в каком-то определенном количестве.

Что же такое «анализ данных»? У нас есть данные, и мы хотим извлечь из них полезные закономерности, которые можно использовать в дальнейшем, например, для повышения эффективности бизнес-процессов, для проведения исследований, планирования и так далее. У многих сразу возникает вопрос: если я смотрю на табличку с числами и пытаюсь найти закономерности, неужели я занимаюсь анализом данных? Честно говоря, да. Если кассир считает вам сдачу, то на вопрос «Занимается ли она математикой?» некоторые могут ответить, что нет, она думает не о гипотезе Римана. С другой стороны, она будет применять те знания, которые она получила в школьном курсе математики. Просто есть математика элементарная, и есть высшая; и в данном случае она занимается элементарной математикой. Так и анализ данных имеет различные градации. Иногда употребляют термин «интеллектуальный анализ данных», но, на мой взгляд, не стоит вводить такую усеченную терминологию, каждый раз из контекста понятно, о чем идет речь. В принципе, это вольный перевод термина data mining — «добыча данных».
Данные постоянно усложнялись. Если мы рассмотрим учебники по машинному обучению середины XX века, то там в основном все ориентировано на информацию, которая записана в вещественные таблички. Потом стали появляться задачи с классификацией текста, которые тоже сводили к задаче с вещественной матрицей. Потом появились специфические тексты, скажем html-документы, xml-файлы, jsn-файлы и так далее. Таким образом, каждый раз информация становилась все более и более сложнее. Более того, появились некоторые объекты, которые еще недавно не были центральными объектами в исследовании, а в 2014 году они представляют крайне важный интерес, например социальные сети. Раньше динамические гигантские графы фактически не исследовались, а появились социальные сети, и появился большой спектр задач, связанный с этим понятием.

Источник: https://postnauka.ru

Страница Александр Дьяконова на сайте "ПостНаука" https://postnauka.ru/author/djakonov