Базовая математика для анализа данных

Хорошему специалисту по анализу данных без базовой математики никуда (а дата-исследователю тем более). Поэтому предлагаем вашему вниманию основные темы/моменты/аспекты основ математики, которые следует знать/подтянуть специалисту по анализу данных.

Основы математического анализа

  1. Функции и их свойства.
  2. Предел функции (основные представления).
  3. Производная функции (+ её геометрический и механический смысл).
  4. Производная сложной функции.
  5. Экстремумы функции. Выпуклость функции.
  6. Частные производные и градиент.
  7. Градиент в задачах оптимизации.
  8. Производная по направлению.
  9. Касательная плоскость и линейное приближение.

Основы линейной алгебры

  1. Векторное пространство.
  2. Линейная независимость.
  3. Норма и скалярное произведение векторов.
  4. Определение матрицы. Операции над матрицами.
  5. Ранг и определитель матрицы.
  6. Системы линейных уравнений.
  7. Типы матриц.
  8. Собственные вектора и собственные значения.
  9. Матричные разложения (спектральное, сингулярное).
  10. Приближение матрицей меньшего ранга.
  11. Сингулярное разложение и низкоранговое приближение.

Методы оптимизации

  1. Оптимизация негладких функций (+ проблема локальных минимумов).
  2. Метод имитации отжига.
  3. Генетические алгоритмы. Алгоритм дифференциальной эволюции.
  4. Метод Нелдера-Мида.

Теория вероятностей и математическая статистика

  1. Определение вероятности. Свойства вероятности.
  2. Условные вероятности. Формула полной вероятности. Формулы Байеса.
  3. Дискретные случайные величины.
  4. Непрерывные случайные величины.
  5. Оценка распределения по выборке. Статистики.
  6. Характеристики распределений.
  7. Важные статистики (выборочные среднее, медиана, мода, дисперсия, интерквартильный размах).
  8. Центральная предельная теорема.
  9. Доверительные интервалы.

Эту базовую математику можно изучить, например, на Coursera в рамках специализации «Машинное обучение и анализ данных» (на русском языке) или поискать материалы в доступных (и уважаемых) учебниках по математическому анализу, линейной алгебре, методам оптимизации, ТВиМС. Много материала доступно в интернете, в том числе и на Википедии с необходимыми ссылками на более подробный материал.

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2019 Data Scientist. Все права защищены.