1. Машинное обучение с Apache Spark

    На текущий момент Apache Spark считается одним из наиболее популярных фреймворков в мире Big Data, благодаря возможности быстро обрабатывать большие объемы данных. Для специалиста по Data Science он предоставляет следующие преимущества: обработка действительно больших объемов данных благодаря распределенной архитектуре и распараллеливанию вычислительных потоков по разделам на разных узлах кластера, который можно масштабировать,...
  2. MLOps подход

    По аналогии с DevOps и DataOps, в связи с популяризацией методов Machine Learning и ростом их практических внедрений, у бизнеса появилась потребность в организации непрерывного сотрудничества и взаимодействия между всеми участниками процессов работы с моделями машинного обучения от бизнеса до инженеров и разработчиков Big Data, включая Data Scientist’ов и ML-специалистов. Понятие MLOps еще...
  3. Искусственный интеллект простыми словами

    Мини-лекция про искусственный интеллект простыми словами. Обсудим как машины обучаются на основе данных, что такое машинное обучение и какие существуют его типы, что такое глубокое обучение и какое место в нем занимают нейронные сети. И связаны ли искусственные нейросети с мозгом? Обсудим также что уже умеет ИИ и как его...
  4. Герои глубокого обучения

    Пионер в области глубокого обучения Andrew Ng (Эндрю Ын) в рамках своих образовательных проектов в сфере искусственного интеллекта провел ряд интервью с исследователями, внесшими существенный вклад в развитие глубокого обучения. Герои выпусков: Yann LeCun, Andrej Karpathy, Ian Goodfellow, Yoshua Bengio, Geoffrey Hinton, Ruslan Salakhutdinov, Yuanqing Lin, Pieter Abbel, Dawn Song....
  5. Схема решения задач глубокого машинного обучения

    Обобщенный процесс решения задачи глубокого машинного обучения: 1. Определение задачи и создание набора данных. 2. Выбор меры успеха. 3. Выбор протокола оценки. 4. Предварительная подготовка данных. 5. Разработка модели, более совершенной, чем базовый случай. 6. Масштабирование по вертикали: разработка модели с переобучением. Поиск границы между недообучением и переобучением. 7. Регуляризация...
  6. Когда стоит использовать глубокое обучение

    Глубокое обучение стоит использовать, когда: более простые модели (логистическая регрессия) не дают требуемой верности; требуется распознавать сложные паттерны в изображениях, NLP или звуковых данных; размерность данных велика; входные данные обладают временным измерением (последовательности). Когда стоит ограничиться традиционным машинным обучением Традиционное машинное обучение стоит использовать, когда: имеются высококачественные данные низкой размерности,...
  7. Глубокое обучение на Python: краткое содержание и выводы

    Примечание-спойлер: обязательно приобретите себе экземпляр этой книги, если вовлечены в сферу data science, ML, DL. Хотел разбить на несколько частей, но лучше оставить один лонгрид. Книга Франсуа Шолле «Глубокое обучение на Python» написана для людей с опытом программирования на Питоне, желающих начать знакомство с технологиями глубокого обучения. Будет интересна и...
  8. Шпаргалки по data science (cheat sheets)

    Несколько читшитов по data science. Про Python, машинное обучение, нейросети, Keras, Spark, визуализацию данных. Основное Python Basics Cheat Sheet Scipy Linear Algebra Cheat Sheet Манипуляции с данными NumPy Basics Cheat Sheet Pandas Data Wrangling Cheat Sheet Основы Pandas xts Cheat sheet data.table Cheat Sheet Tidyverse Cheat Sheet Машинное обучение, глубокое...
  9. Машинное обучение на больших данных

    Рассмотрим библиотеку MlLib в Spark и покажем, как решать задачи машинного обучения — классификации, регресии, кластеризации, а также коллаборативной фильтрации. Кроме этого покажем, как можно исследовать признаки с целью отбора и выделения новых (т.н. Feature Engineering). Вектора Для простых «плотных» векторов есть специальный класс Vectors.dense:   Для «разреженных» векторов...
  10. Тренировки по машинному обучению

    Набор видео-тренировок по решению задач с помощью методов машинного обучения. Участие в соревнованиях Kaggle, различных хакатонах и других конкурсах. Обзор лучших решений Все видео канала

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2016-2021 Data Scientist. Все права защищены.