Алгоритмы | Data Science

Два
Раз

Главная / Алгоритмы

Как выбирать алгоритмы для машинного обучения

19.10.2017

Разновидности машинного обучения Обучение с учителем Алгоритмы обучения с учителем делают прогнозы на основе набора примеров. Так, чтобы предсказать цены в будущем, можно использовать курс акций в прошлом. Каждый пример, используемый для обучения, получает свою отличительную метку значения, в данном случае это курс акций. Алгоритм обучения с учителем ищет закономерности...
Подробнее...
Отбор информативных признаков

01.10.2017

Данная статья предназначена для статистиков, инженеров машинного обучения и специалистов, которые интересуются вопросами обнаружения зависимостей в наборах данных. Также материал, изложенный в статье, может быть интересен широкому кругу читателей, неравнодушных к data mining. В материале не будут затронуты вопросы feature engineering и, в частности, применения таких методов как анализ главных...
Подробнее...
Почему ошибаются алгоритмы машинного обучения

17.09.2017

Мы часто слышим о том, как очередной сложный алгоритм искусственного интеллекта начал ошибаться или стал следовать предрассудкам, которым машины не должны быть подвержены. Почему так происходит? Из-за чего появляются эти ложные положительные и отрицательные ответы и так ли это важно? Для начала давайте определим три термина из Матрицы смешения: точность,...
Подробнее...
Основные алгоритмы машинного обучения с реализацией в R и Python

15.05.2017

Broadly, there are 3 types of Machine Learning Algorithms: 1. Supervised Learning How it works: This algorithm consist of a target / outcome variable (or dependent variable) which is to be predicted from a given set of predictors (independent variables). Using these set of variables, we generate a function that map inputs to desired...
Подробнее...
Алгоритм CART

02.04.2017

CART (classification and regression trees) – это аббревиатура, обозначающая методы классификации и регрессии с использованием дерева решений. Это методика обучения, основанная на деревьях решений, которая возвращает классификационные или регрессионные деревья. Как было в случае с C4.5, CART – это классификатор. Дерево классификации выглядит так же как дерево решений? Дерево классификаций...
Подробнее...
Наивный баейсовский классификатор

25.03.2017

Девятый алгоритм из цикла «Топ-10 data mining адгоритмов» — Naive Bayes. Наивный байесовский классификатор – это семейство алгоритмов классификации, которые принимают одно допущение: Каждый параметр классифицируемых данных рассматривается независимо от других параметров класса. Что означает слово «независимо»? 2 параметра называются независимыми, когда значение одного параметра не оказывает влияния на второй....
Подробнее...
Алгоритм k-ближайших соседей

11.03.2017

Алгоритм k-ближайших соседей продолжает серию статей о Топ-10 data mining алгоритмах. kNN (k-Nearest Neighbors) – это алгоритм классификации, однако это – ленивый классификатор. Что значит ленивый классификатор? Это означает, что в процессе обучения он не делает ничего, а только хранит тренировочные данные. Он начинает классификацию только тогда, когда появляются новые...
Подробнее...
Алгоритм AdaBoost

17.02.2017

Продолжаем разбор алгоритмов в рамках «Топ-10 data mining алгоритмов» и рассмотрим алгоритм AdaBoost. Что он делает? AdaBoost – это алгоритм усиления классификаторов. Как вы помните, классификатор пытается предсказать по уже известным ему данным, к какому классу будут относиться новые данные. Что такое усиление? Усиление – это ансамблевый алгоритм обучения, который...
Подробнее...
The worst predictive modeling techniques

21.07.2016

Typically, these bad techniques are still widely used. Linear regression. Relies on the normal, heteroscedasticity and other assumptions, does not capture highly non-linear, chaotic patterns. Prone to over-fitting. Parameters difficult to interpret. Very unstable when independent variables are highly correlated. Fixes: variable reduction, apply a transformation to your variables, use...
Подробнее...
Алгоритмический бизнес

10.07.2016

7 причин, почему алгоритмический бизнес изменит наше общество. Мир движется настолько быстро, что уже бигдата является вчерашним днём, на смену пришла операционная аналитика (аналитика 3.0), а бизнес процессы уже могут быть автоматизированы. But in big data itself is no value at all. We can all generate massive amounts of data...
Подробнее...