1. Что такое ETL?

    ETL (от англ. Extract, Transform, Load — дословно «извлечение, преобразование, загрузка») — один из основных процессов в управлении хранилищами данных, который включает в себя: извлечение данных из внешних источников; их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели; и загрузка их в хранилище данных. С точки зрения процесса ETL, архитектуру...
  2. Методы и метрики оценки модели, которые должен знать каждый

    Рассмотрим 11 важных методов оценки модели, которые должен знать каждый data scientist. Model evaluation metrics are used to assess goodness of fit between model and data, to compare different models, in the context of model selection, and to predict how predictions (associated with a specific model and data set) are...
  3. C чего начать глубинное обучение?

    Ресурсы по глубинному обучению. Как и с чего начать изучение глубинного обучения? Due to the recent achievements of artificial neural networks across many different tasks (such as face recognition, object detection and Go), deep learning has become extremely popular. This post aims to be a starting point for those interested...
  4. Применение статистического моделирования: 24 метода

    1. Spatial Models Spatial dependency is the co-variation of properties within geographic space: characteristics at proximal locations appear to be correlated, either positively or negatively. Spatial dependency leads to the spatial auto-correlation problem in statistics since, like temporal auto-correlation, this violates standard statistical techniques that assume independence among observations 2....
  5. 18 методов анализа данных для бизнес-менеджера

    Топ-18 методов анализа данных, которые должен знать и понимать каждый бизнес-менеджер. 1. Business experiments: Business experiments, experimental design and AB testing are all techniques for testing the validity of something – be that a strategic hypothesis, new product packaging or a marketing approach. It is basically about trying something in...
  6. Топ-45 методов data science

    Основные методы data science: Linear Regression Logistic Regression Jackknife Regression Density Estimation Confidence Interval Test of Hypotheses Pattern Recognition Clustering — (Unsupervised Learning) Supervised Learning Time Series Decision Trees Random Numbers Monte-Carlo Simulation Bayesian Statistics Naive Bayes Principal Component Analysis — (PCA) Ensembles Neural Networks Support Vector Machine — (SVM)...
  7. The worst predictive modeling techniques

    Typically, these bad techniques are still widely used. Linear regression. Relies on the normal, heteroscedasticity and other assumptions, does not capture highly non-linear, chaotic patterns. Prone to over-fitting. Parameters difficult to interpret. Very unstable when independent variables are highly correlated. Fixes: variable reduction, apply a transformation to your variables, use...
  8. Мультивариативные тесты

    Представьте, вы сделали новый дизайн лендинга. Проверили аудиторию A/A-тестом и наконец-то сравнили старый дизайн (вариант A) и новый (вариант B). Допустим, новый показал конверсию на 15% выше. Отличный результат! Однако, шампанское пока лучше отложить. Настоящее тестирование только начинается. Подумайте, что еще способно повлиять на конверсию? Например, для целевой страницы стоит...
  9. Что такое эджайл?

    Проекты в сфере data science и разработка соответствующих продуктов командой data scientists требуют использования эффективных методик. Одной из таких методик является эджайл (agile). Для чего применяется методология Agile? Ускорение вывода продукта на рынок. Если вы хотите что-то сделать быстрее, нужно делать это в соответствии с Agile. Очень простой пример. Есть...

Data Scientist # 1

Data science, большие данные, наука о данных, анализ данных, маркетинг, искусственный интеллект, бизнес-аналитика, business intelligence, data scientist, data analysis, artificial intelligence, big data, data mining.

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2018 Data Scientist. Все права защищены.