1. Представление данных, хранение и подготовка к анализу

    В данном обзоре мы рассмотрим вопросы предобработки данных (в том числе их очистку), их представление, хранение. Поговорим про форматы данных, типы данных, базы данных и открытые данные. Предобработка данных Зачем данные нуждаются в предобработке? Чистые данные существуют только в учебниках и поэтому перед анализом их необходимо «очистить». Причины «грязноты» данных:
  2. Инфраструктура для Больших Данных

    Мы собираемся обсудить вопросы аналитики данных на больших масштабах, разобраться с облачными вычислениями (cloud computing), описать методы и инструменты работы с большими объёмами информации и потоками данных. Также обсудим элементы распределённой вычислительной инфраструктуры, сравним опенсорсные и коммерческие решения. Быстро пройдёмся по YARN / Apache 2, Spark, Pig, Storm, MapReduce. Напомним,...
  3. Введение в Большие Данные

    Большие данные вошли в наш оборот, став некой маркетинговой уловкой. Многие компании начали всерьёз задумываться начать заниматься “биг датой”, но не знают с чего начать и что для этого нужно, но знают, что это может принести компании неплохую прибыль в будущем (а может и не принести). Этот хайп уже начал...
  4. Принцип Бонферрони

    Пусть имеются какие-то данные, и мы ищем в них события определенного вида. Можно ожидать, что такие событие встретятся, даже если данные выбраны абсолютно случайно, а количество событий будет расти вместе с объемом данных. Эти события «фиктивные» в том смысле, что у них нет никакой причины, помимо случайности данных, а в...
  5. Заметки по data science-1

    Заметки по data science. Краткое введение в науку о данных. В частности, рассмотрим ряд определений data science, составные части (наука и данные), выясним, есть ли наука в “науке о данных”, рассмотрим особенности датификации, пирамиду знаний, разберём этапы анализа данных, особенности дата майнинга, проблемы сбора и анализа данных, дата-аналитическое мышление и...

Data Scientist # 1

Data science, большие данные, наука о данных, анализ данных, маркетинг, искусственный интеллект, бизнес-аналитика, business intelligence, data scientist, data analysis, artificial intelligence, big data, data mining.

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2018 Data Scientist. Все права защищены.