1. Что делать с данными?

    Вот данные попали вам в руки — что с ними делать, с чего начать и чем закончить? Вот примерная схема: 1. Очистка данных Структурируйте и очистите данные. Рассмотрите и приведите в порядок все переменные. 2. Имейте чёткую цель Для чего вам нужны данные и какую пользу/информацию вы хотите извлечь и...
  2. Заблуждения из data science

    1. Корреляция = причинность. Большие данные = информация и инсайты, потому что контекст не имеет значения. 2. Ошибка базового процента (игнорирование базового уровня) актуальна только для малых выборок. 3. Драгирование данных (data dredging) отрицательно коррелирует с размером совокупности данных, т.е. количество ложных корреляций уменьшается с ростом размерности набора данных. 4....
  3. Популярные презентации по data science

    Рассмотрим наиболее популярные презентации из области data science, размещённые на Slideshare. The Rise of Big Graph Data The Science of Managing Data Scientists How to Interview a Data Scientist What Does a Data Scientist Do? Titan: Big Graph Data with Cassandra Myths and Mathemagical Superpowers of Data Scientists Introduction to...
  4. 9 советов начинающему исследователю данных

    1. Освежите в памяти знания по математике и статистике Математика и статистика играю важную роль в анализе данных и понимании того, что данные показывают нам. На начальном этапе достаточно базовой математики и статистики, а на более специфичных должностях могут быть необходимы углубленные знания. 2. Изучите основы машинного обучения Машинное обучение...
  5. Анализ данных и конфиденциальность

    Организации могут последовать примеру правительства и внедрить систему разноуровневого допуска. Доверенные лица, занимающиеся обнаружением данных, должны иметь максимальную свободу действий, чтобы способствовать инсайтам, включая комбинирование данных способами, обычно не дозволяемыми в организации. При оценке приемлемости анализа с точки зрения конфиденциальности убедитесь в том, что он проходит три разных теста. Анализ...
  6. Аналитика 3.0

    Чем больше данных, тем «умнее» наш мир. Операционная аналитика — это интегрированные автоматические процессы принятия решений, предписывающие и реализующие действия в пределах «времени принятия решения». Как только операционно-аналитический процесс получает одобрение и запускается, он начинает автоматически принимать тысячи или миллионы решений. Поколения (эпохи) аналитики: Аналитика 1.0: традиционная аналитика (преимущественно описательная...
  7. Questions & Answers: Process & Miscellaneous

    1. How to optimize algorithms? (parallel processing and/or faster algorithms). Provide examples for both “Premature optimization is the root of all evil”; Donald Knuth Parallel processing: for instance in R with a single machine. — doParallel and foreach package — doParallel: parallel backend, will select n-cores of the machine —...
  8. Questions & Answers: Statistics

    1. How do you assess the statistical significance of an insight? Is this insight just observed by chance or is it a real insight? Statistical significance can be accessed using hypothesis testing: — Stating a null hypothesis which is usually the opposite of what we wish to test (classifiers A...
  9. Базовая математика для анализа данных

    Хорошему специалисту по анализу данных без базовой математики никуда (а дата-исследователю тем более). Поэтому предлагаем вашему вниманию основные темы/моменты/аспекты основ математики, которые следует знать/подтянуть специалисту по анализу данных. Основы математического анализа Функции и их свойства. Предел функции (основные представления). Производная функции (+ её геометрический и механический смысл). Производная сложной функции....
  10. Questions & Answers: Machine Learning & Math

    Machine Learning & Mathematics 1. What is cross-validation? How to do it right? It’s a model validation technique for assessing how the results of a statistical analysis will generalize to an independent data set. Mainly used in settings where the goal is prediction and one wants to estimate how accurately...

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2020 Data Scientist. Все права защищены.