1. Беспилотный автомобиль: что внутри

    По данным компании Gartner, в 2018 году было выпущено чуть больше 137 тыс. беспилотных автомобилей, а в 2019 — уже свыше 330 тыс. Аналитики прогнозируют, что к 2023 году количество автономных транспортных средств на дорогах достигнет 745 тыс. Готовы ли вы к этому? Мы составили список основных понятий, которые помогут вам сориентироваться...
  2. Что такое ETL?

    ETL (от англ. Extract, Transform, Load — дословно «извлечение, преобразование, загрузка») — один из основных процессов в управлении хранилищами данных, который включает в себя: извлечение данных из внешних источников; их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели; и загрузка их в хранилище данных. С точки зрения процесса ETL, архитектуру...
  3. Методы и метрики оценки модели, которые должен знать каждый

    Рассмотрим 11 важных методов оценки модели, которые должен знать каждый data scientist. Model evaluation metrics are used to assess goodness of fit between model and data, to compare different models, in the context of model selection, and to predict how predictions (associated with a specific model and data set) are...
  4. C чего начать глубинное обучение?

    Ресурсы по глубинному обучению. Как и с чего начать изучение глубинного обучения? Due to the recent achievements of artificial neural networks across many different tasks (such as face recognition, object detection and Go), deep learning has become extremely popular. This post aims to be a starting point for those interested...
  5. Применение статистического моделирования: 24 метода

    1. Spatial Models Spatial dependency is the co-variation of properties within geographic space: characteristics at proximal locations appear to be correlated, either positively or negatively. Spatial dependency leads to the spatial auto-correlation problem in statistics since, like temporal auto-correlation, this violates standard statistical techniques that assume independence among observations 2....
  6. 18 методов анализа данных для бизнес-менеджера

    Топ-18 методов анализа данных, которые должен знать и понимать каждый бизнес-менеджер. 1. Business experiments: Business experiments, experimental design and AB testing are all techniques for testing the validity of something – be that a strategic hypothesis, new product packaging or a marketing approach. It is basically about trying something in...
  7. Топ-45 методов data science

    Основные методы data science: Linear Regression Logistic Regression Jackknife Regression Density Estimation Confidence Interval Test of Hypotheses Pattern Recognition Clustering — (Unsupervised Learning) Supervised Learning Time Series Decision Trees Random Numbers Monte-Carlo Simulation Bayesian Statistics Naive Bayes Principal Component Analysis — (PCA) Ensembles Neural Networks Support Vector Machine — (SVM)...
  8. The worst predictive modeling techniques

    Typically, these bad techniques are still widely used. Linear regression. Relies on the normal, heteroscedasticity and other assumptions, does not capture highly non-linear, chaotic patterns. Prone to over-fitting. Parameters difficult to interpret. Very unstable when independent variables are highly correlated. Fixes: variable reduction, apply a transformation to your variables, use...
  9. Мультивариативные тесты

    Представьте, вы сделали новый дизайн лендинга. Проверили аудиторию A/A-тестом и наконец-то сравнили старый дизайн (вариант A) и новый (вариант B). Допустим, новый показал конверсию на 15% выше. Отличный результат! Однако, шампанское пока лучше отложить. Настоящее тестирование только начинается. Подумайте, что еще способно повлиять на конверсию? Например, для целевой страницы стоит...

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2016-2021 Data Scientist. Все права защищены.