1. Разница между предиктивной аналитикой и дата майнингом

    What is Predictive Analytics? According to Wikipedia, “Predictive analytics encompasses a variety of statistical techniques from predictive modeling, machine learning, and data mining that analyze current and historical facts to make predictions about future or otherwise unknown events.” What’s behind Predictive Analytics? Prerequisite for Predictive Analytics is the collection of...
  2. Типы регрессий

    Какой тип регрессии выбрать и использовать? Зависит ли это от контекста? Это не секрет, что существует множество видов регрессии и важно знать их недостатки и широту использования. Давайте рассмотрим некоторые из них. Linear regression: Oldest type of regression, designed 250 years ago; computations (on small data) could easily be carried...
  3. The worst predictive modeling techniques

    Typically, these bad techniques are still widely used. Linear regression. Relies on the normal, heteroscedasticity and other assumptions, does not capture highly non-linear, chaotic patterns. Prone to over-fitting. Parameters difficult to interpret. Very unstable when independent variables are highly correlated. Fixes: variable reduction, apply a transformation to your variables, use...
  4. Class of metrics: bumpiness

    All statistical textbooks focus on centrality (median, average or mean) and volatility (variance). None mention the third fundamental class of metrics: bumpiness. Here we introduce the concept of bumpiness and show how it can be used. Two different datasets can have same mean and variance, but a different bumpiness. Bumpiness...
  5. Ошибки на собеседовании data science

    При собеседовании на должность в сфере data science соискатели часто допускают банальные ошибки, которую снижают их шансы быть принятым на работу. Вот некоторые из них: Not doing any research on the company prior to the interview. Not understanding whether they want to hire a scientist or a developer. In many...
  6. Жизнь исследователя данных

    Data scientists are big data wranglers. They take an enormous mass of messy data points (unstructured and structured) and use their formidable skills in math, statistics and programming to clean, massage and organize them. Then they apply all their analytic powers – industry knowledge, contextual understanding, skepticism of existing assumptions...
  7. Ошибки при подготовке данных

    Рассмотрим топ-5 ошибок, которые совершают при подготовке данных к анализу. 1. Including ID Fields as Predictors Because lots of IDs look like continuous integers (and older IDs are typically smaller), it is possible that they may make their way into the model as a predictive variables. Be sure to exclude...

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2016-2021 Data Scientist. Все права защищены.