1. Отбор информативных признаков

    Данная статья предназначена для статистиков, инженеров машинного обучения и специалистов, которые интересуются вопросами обнаружения зависимостей в наборах данных. Также материал, изложенный в статье, может быть интересен широкому кругу читателей, неравнодушных к data mining. В материале не будут затронуты вопросы feature engineering и, в частности, применения таких методов как анализ главных...
  2. 18 методов анализа данных для бизнес-менеджера

    Топ-18 методов анализа данных, которые должен знать и понимать каждый бизнес-менеджер. 1. Business experiments: Business experiments, experimental design and AB testing are all techniques for testing the validity of something – be that a strategic hypothesis, new product packaging or a marketing approach. It is basically about trying something in...
  3. Инструменты для очистки данных

    Как говорится, чистые данные существуют только в учебниках. Большинство имеющихся данных неструктурированы, содержат много потерянных элементов, могут содержать дубликаты и прочие «мусорные» значения. Поэтому одним из важнейших, базовых и часто самых трудоёмких этапов анализа данных является их очистка. Но есть полезные инструменты, которые приходят на помощь при очистке данных. Рассмотрим...
  4. Что делать с данными?

    Вот данные попали вам в руки — что с ними делать, с чего начать и чем закончить? Вот примерная схема: 1. Очистка данных Структурируйте и очистите данные. Рассмотрите и приведите в порядок все переменные. 2. Имейте чёткую цель Для чего вам нужны данные и какую пользу/информацию вы хотите извлечь и...
  5. Ошибки при подготовке данных

    Рассмотрим топ-5 ошибок, которые совершают при подготовке данных к анализу. 1. Including ID Fields as Predictors Because lots of IDs look like continuous integers (and older IDs are typically smaller), it is possible that they may make their way into the model as a predictive variables. Be sure to exclude...
  6. Анализ данных и конфиденциальность

    Организации могут последовать примеру правительства и внедрить систему разноуровневого допуска. Доверенные лица, занимающиеся обнаружением данных, должны иметь максимальную свободу действий, чтобы способствовать инсайтам, включая комбинирование данных способами, обычно не дозволяемыми в организации. При оценке приемлемости анализа с точки зрения конфиденциальности убедитесь в том, что он проходит три разных теста. Анализ...
  7. Базовая математика для анализа данных

    Хорошему специалисту по анализу данных без базовой математики никуда (а дата-исследователю тем более). Поэтому предлагаем вашему вниманию основные темы/моменты/аспекты основ математики, которые следует знать/подтянуть специалисту по анализу данных. Основы математического анализа Функции и их свойства. Предел функции (основные представления). Производная функции (+ её геометрический и механический смысл). Производная сложной функции....
  8. Дизайн на основе данных

    Внешние изменения в сегодняшнем веб-дизайне можно свести к формуле «трех У»: упрощение, уплощение, унификация. Главный внутренний тренд — дизайн на основе данных. Data-Driven Design — это проектирование продукта на основе данных: исследований, тестов, проверки гипотез, Big Data. Прежний подход подразумевал, что дизайн-решения принимает дизайнер, целиком основываясь на своем опыте, понимании...
  9. Обработка данных и инструменты

    При обработке данных встречается несколько типичных ситуаций, и для каждой из них существуют свои подходы и свои инструменты. Рассмотрим основные из них. Точечная обработка активных данных Самый частый сценарий, с которым нам всем приходится сталкиваться, это хранение «активных» данных — информации о пользователях, списка товаров, комментариев к статьям и т.д....
  10. Собираем веб-данные с помощью R

    Для того чтобы принять участие в сборе данных, вам понадобится иметь в арсенале серьезное оружие. Cначала проверьте, установлено ли у вас R (программное обеспечение для статистических вычислений) и RStudio (среда разработки программного обеспечения для языка программирования R). Исследуем базы данных команды NBA с сайта Basketball Reference. Посмотрим на сезон 2013-2014....

Data Scientist # 1

Data science, большие данные, наука о данных, анализ данных, маркетинг, искусственный интеллект, бизнес-аналитика, business intelligence, data scientist, data analysis, artificial intelligence, big data, data mining.

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2018 Data Scientist. Все права защищены.