Если вы вдруг решили самостоятельно начать изучать теорию (и практику) анализа данных, то в качестве ориентира можно взять существующие учебные программы курсов, предлагаемых по этой тематике. Данный план взят у курса от Билайна.
Кстати, список курсов, блогов и пр. мы упоминали вот здесь: Курсы и ресурсы по Big Data и Data Science
1. Введение в машинное обучение. Основные типы задач и методы их решения
Теория
2. Библиотеки и инструменты для анализа данных. Математика в машинном обучении
Теория
Практика
3. Обучение с учителем. Задачи классификации и регрессии
Теория
Практика
4. Оценка качества алгоритмов машинного обучения
Теория
Практика
5. Продвинутые методы классификации и регрессии. Переобучение
Теория
Практика
6. Обучение без учителя
Теория
Практика
7. Анализ социальных сетей
Теория
Практика
8. Обнаружение знаний в данных
Теория
Практика
9. Рекомендательные системы
Теория
Практика
10. Обработка текстов
Теория
Практика
11. Введение в анализ больших данных и масштабируемое машинное обучение
Теория
Практика
12. Альтернатива большим данным. Large Scale Machine Learning. Обзор инструмента vowpal wabbit
Теория
Практика
13. Соревнования по анализу данных
Теория
Практика