1. Инфраструктура для Больших Данных

    Мы собираемся обсудить вопросы аналитики данных на больших масштабах, разобраться с облачными вычислениями (cloud computing), описать методы и инструменты работы с большими объёмами информации и потоками данных. Также обсудим элементы распределённой вычислительной инфраструктуры, сравним опенсорсные и коммерческие решения. Быстро пройдёмся по YARN / Apache 2, Spark, Pig, Storm, MapReduce. Напомним,...
  2. Введение в Большие Данные

    Большие данные вошли в наш оборот, став некой маркетинговой уловкой. Многие компании начали всерьёз задумываться начать заниматься “биг датой”, но не знают с чего начать и что для этого нужно, но знают, что это может принести компании неплохую прибыль в будущем (а может и не принести). Этот хайп уже начал...
  3. Сценарии использования Больших Данных

    Перечислим некоторые явные сценарии использования Больших Данных. 1. Энергетика: аналитические технологии Больших Данных способны на 99 % повысить точность распределения имеющихся мощностей электроэнергии и проанализировать где выгоднее закупать недостающую их часть. 2. Банковский сектор: Большие Данные способны решать практически все ключевые задачи банков: привлечение клиентов, повышение качества услуг, оценка заемщиков,...
  4. Популярные презентации по data science

    Рассмотрим наиболее популярные презентации из области data science, размещённые на Slideshare. The Rise of Big Graph Data The Science of Managing Data Scientists How to Interview a Data Scientist What Does a Data Scientist Do? Titan: Big Graph Data with Cassandra Myths and Mathemagical Superpowers of Data Scientists Introduction to...
  5. Операционная аналитика, большие данные и интернет вещей

    Не поддавайтесь давлению и не используйте большие данные только ради того, чтобы показать, что вы их используете! Ваша задача — создать системы и наладить сбор данных для поддержки только обоснованных возможностей бизнеса. Многие сильные организации поддались всеобщей лихорадке вокруг больших данных, что грозит обернуться для них весьма поучительными и дорогостоящими...
  6. Что такое NoSQL

    NoSQL (англ. not only SQL, не только SQL) — термин, обозначающий ряд подходов, направленных на реализацию хранилищ баз данных, имеющих существенные отличия от моделей, используемых в традиционных реляционных СУБД с доступом к данным средствами языка SQL. Применяется к базам данных, в которых делается попытка решить проблемы масштабируемости (scalability) и доступности...
  7. Закат Big Data

    Предлагаем ознакомиться с одним из мнений, почему нас ждёт закат Big Data и закат ли это. Вот некоторые мысли/заметки/цитаты/утверждения (Источник). Gartner в в августе 2015 года исключил Big Data из числа прорывных технологий (emerging technologies) и удалил её с графика Hype Cycle. В исследовании, озаглавленном “The Demise of Big Data,...
  8. Курс по изучению машинного обучения и анализа данных

    Если вы вдруг решили самостоятельно начать изучать теорию (и практику) анализа данных, то в качестве ориентира можно взять существующие учебные программы курсов, предлагаемых по этой тематике. Данный план взят у курса от Билайна. Кстати, список курсов, блогов и пр. мы упоминали вот здесь: Курсы и ресурсы по Big Data и...
  9. Технологии обработки больших данных

    Big data (большие данные) — огромные объемы неоднородной и быстро поступающей цифровой информации, которые невозможно обработать традиционными инструментами. В русскоязычной среде под большими данными подразумевают также технологии их обработки. В мировой практике большими данными называют только объект анализа. Термин big data родился в 2008 году. Редактор журнала Nature Клиффорд Линч...

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2020 Data Scientist. Все права защищены.