-
Алгоритм CART
02.04.2017CART (classification and regression trees) – это аббревиатура, обозначающая методы классификации и регрессии с использованием дерева решений. Это методика обучения, основанная на деревьях решений, которая возвращает классификационные... -
24 совета исследователю данных
01.04.2017Leverage external data sources: tweets about your company or your competitors, or data from your vendors (for instance, customizable newsletter eBlast statistics available via vendor dashboards, or... -
Наивный баейсовский классификатор
25.03.2017Девятый алгоритм из цикла «Топ-10 data mining адгоритмов» — Naive Bayes. Наивный байесовский классификатор – это семейство алгоритмов классификации, которые принимают одно допущение: Каждый параметр классифицируемых данных... -
Алгоритм k-ближайших соседей
11.03.2017Алгоритм k-ближайших соседей продолжает серию статей о Топ-10 data mining алгоритмах. kNN (k-Nearest Neighbors) – это алгоритм классификации, однако это – ленивый классификатор. Что значит ленивый классификатор?... -
Как Facebook собирает и использует данные
22.02.2017План статьи такой: предисловие на русском, потом описание на английском. Лонгрид. Не секрет, что фейсбук собирает огромное количество данных о своих пользователях, включая удаленные и недописанные посты,... -
Алгоритм AdaBoost
17.02.2017Продолжаем разбор алгоритмов в рамках «Топ-10 data mining алгоритмов» и рассмотрим алгоритм AdaBoost. Что он делает? AdaBoost – это алгоритм усиления классификаторов. Как вы помните, классификатор пытается... -
Математическое мышление для data scientist
01.02.2017Математика очень важна для data scientist’a и не имеет значения, занимаешься ты управлением data science проектов или являешься непосредственно аналитиком. И здесь важны не только сами знания,... -
Топ-5 data отчётов для маркетологов (SaaS)
24.01.2017Топ-5 отчетов, необходимых руководителю и маркетологу для того, чтобы принимать обоснованные решения в продвижении и разработке. Дополнительно используется Kissmetriсs. Отчет № 1 «Воронки по рекламным каналам» Проблематика следующая:... -
Гид по SQL
05.01.2017SQL is one of the core skills of a data engineer and data scientist. This mini-tutorial explains the four fundamental SQL functions: Create, Read, Update, and Delete... -
Красивые дендрограммы в R
04.01.2017В R есть несколько функций для построения и стилизации дендрограмм. В данной статье рассматривается 5+ методов для построения красивых дендрограмм с помощью R. We start by computing...