1. 12 алгоритмов, которые должен знать каждый data scientist

    Алгоритмы являются неотъемлемой частью обработки данных. Предлагаем рассмотреть инфографику о 12 блоков алгоритмов, которые должен знать каждый исследователь данных. Внутри «блоков» имеется список присущих блоку алгоритмов. Источник
  2. Алгоритм PageRank

    Продолжаем описание популярных алгоритмов из серии «Топ-10 data mining алгоритмов» и сегодня весьма интересный случай — алгоритм PageRank. PageRank – это алгоритм ссылочного ранжирования, разработанный для определения относительной важности объекта, связанного с сетью объектов. Ссылочное ранжирование? Это тип сетевого анализа, определяющий ассоциации (читай, связи) между объектами. Вот пример: Наиболее известный...
  3. EM-алгоритм

    Переходим к следующему алгоритму в рамках «Топ-10 data mining алгоритмов», а именно к EM-алгоритму. В data mining алгоритм максимизации ожидания (expectation-maximization (EM) обычно используется как кластерный алгоритм (наподобие алгоритма к-средних) для обнаружения знаний. В математической статистике EM-алгоритм считается итерационным и используется для оценки максимального правдоподобия при вычислении параметров статистической модели...
  4. Алгоритм TensorFlow

    Алгоритм TensorFlow — это алгоритм от Google, представляющий собой систему для создания и обучения нейронных сетей, которые могут помочь в решении самых различных задач. В частности, Гугл использует TensorFlow в сервисах распознавания речи, поиске фотографий в Google Photos, создании музыки и в сервисе Smart Reply. Кроме того, TensorFlow можно использовать...
  5. Алгоритмы Machine Learning в Python

    Наиболее распространенными инструментами Data Scientist’а на сегодняшний день являются R и Python. У каждого инструмента есть свои плюсы и минусы, но неплохую позицию по всем параметрам занимает Python. Для Питона есть отлично документированная библиотека Scikit-Learn, в которой реализовано большое количество алгоритмов машинного обучения. Здесь мы остановимся на алгоритмах Machine Learning....
  6. Алгоритм Apriori

    Идём дальше в цикле статей Топ-10 data mining алгоритмов и рассматриваем полезный и интересный алгоритм Apriori (Априори). Алгоритм Apriori ищет ассоциативные правила и применяется по отношению к базам данных, содержащим огромное количество транзакций. Что такое ассоциативные правила? Изучение ассоциативных правил – это техника, применяемая в data mining для изучения соотношений...
  7. Метод опорных векторов (SVM)

    Продолжаем цикл статей про Топ-10 data mining алгоритмов. Сегодня у нас на проводе интересный алгоритм дата майнинга — метод опорных векторов. Метод опорных векторов (SVM – Support vector machines) использует гиперплоскость, чтобы классифицировать данные по 2 классам. На верхнем уровне SVM выполняет те же операции, что и C4.5, но с...
  8. Метод k-средних

    Продолжаем описывать популярные алгоритмы из data mining, сегодня остановимся на методе к-средних (k-means). Метод к-средних создает к-групп из набора объектов таким образом, чтобы члены группы были наиболее однородными. Это популярная техника кластерного анализа для исследования набора данных. А что такое кластерный анализ? Кластерный анализ – это семейство алгоритмов, разработанных для...
  9. Алгоритм C4.5

    В статье Топ-10 data mining алгоритмов мы обозначили наиболее популярные алгоритмы дата майнинга. Начинаем с алгоритма C4.5. Алгоритм C4.5 строит классификатор в форме дерева решений. Чтобы сделать это, ему нужно передать набор уже классифицированных данных. А что такое классификатор? Классификатор – это инструмент, применяемый в data mining, который использует классифицированные...
  10. Топ-10 data mining алгоритмов

    Предлагаем вашему вниманию 10 самых эффективных data mining алгоритмов, которые описала группа авторов в докладе «Top 10 algorithms in data mining». Описание этих алгоритмов (в соответствии с оригиналом) будет довольно базовое. В этой статье мы только их перечислим, а их описание будет доступно по ссылкам на названии. Дополнительно мы для...

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2016-2021 Data Scientist. Все права защищены.