1. Методы и метрики оценки модели, которые должен знать каждый

    Рассмотрим 11 важных методов оценки модели, которые должен знать каждый data scientist. Model evaluation metrics are used to assess goodness of fit between model and data, to compare different models, in the context of model selection, and to predict how predictions (associated with a specific model and data set) are...
  2. Применение статистического моделирования: 24 метода

    1. Spatial Models Spatial dependency is the co-variation of properties within geographic space: characteristics at proximal locations appear to be correlated, either positively or negatively. Spatial dependency leads to the spatial auto-correlation problem in statistics since, like temporal auto-correlation, this violates standard statistical techniques that assume independence among observations 2....
  3. Разница между предиктивной аналитикой и дата майнингом

    What is Predictive Analytics? According to Wikipedia, “Predictive analytics encompasses a variety of statistical techniques from predictive modeling, machine learning, and data mining that analyze current and historical facts to make predictions about future or otherwise unknown events.” What’s behind Predictive Analytics? Prerequisite for Predictive Analytics is the collection of...
  4. Типы регрессий

    Какой тип регрессии выбрать и использовать? Зависит ли это от контекста? Это не секрет, что существует множество видов регрессии и важно знать их недостатки и широту использования. Давайте рассмотрим некоторые из них. Linear regression: Oldest type of regression, designed 250 years ago; computations (on small data) could easily be carried...
  5. The worst predictive modeling techniques

    Typically, these bad techniques are still widely used. Linear regression. Relies on the normal, heteroscedasticity and other assumptions, does not capture highly non-linear, chaotic patterns. Prone to over-fitting. Parameters difficult to interpret. Very unstable when independent variables are highly correlated. Fixes: variable reduction, apply a transformation to your variables, use...
  6. Class of metrics: bumpiness

    All statistical textbooks focus on centrality (median, average or mean) and volatility (variance). None mention the third fundamental class of metrics: bumpiness. Here we introduce the concept of bumpiness and show how it can be used. Two different datasets can have same mean and variance, but a different bumpiness. Bumpiness...
  7. Questions & Answers: Statistics

    1. How do you assess the statistical significance of an insight? Is this insight just observed by chance or is it a real insight? Statistical significance can be accessed using hypothesis testing: — Stating a null hypothesis which is usually the opposite of what we wish to test (classifiers A...
  8. Базовая математика для анализа данных

    Хорошему специалисту по анализу данных без базовой математики никуда (а дата-исследователю тем более). Поэтому предлагаем вашему вниманию основные темы/моменты/аспекты основ математики, которые следует знать/подтянуть специалисту по анализу данных. Основы математического анализа Функции и их свойства. Предел функции (основные представления). Производная функции (+ её геометрический и механический смысл). Производная сложной функции....
  9. Questions & Answers for Data Science

    Here you can find some questions and answers related to Data Science mentioned here. We divided them into 3 parts as follows: Machine Learning & Mathematics Statistics Process & Miscellaneous List of questions you can find here.
  10. Доверительные интервалы и их применение

    Взяв выборку из популяции, мы получим точечную оценку интересующего нас параметра и вычислим стандартную ошибку для того, чтобы указать точность оценки. Однако, для большинства случаев стандартная ошибка как такова не приемлема. Гораздо полезнее объединить эту меру точности с интервальной оценкой для параметра популяции. Это можно сделать, используя знания о теоретическом...

Data Scientist # 1

Data science, большие данные, наука о данных, анализ данных, маркетинг, искусственный интеллект, бизнес-аналитика, business intelligence, data scientist, data analysis, artificial intelligence, big data, data mining.

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2018 Data Scientist. Все права защищены.