1. Алгоритм TensorFlow

    Алгоритм TensorFlow — это алгоритм от Google, представляющий собой систему для создания и обучения нейронных сетей, которые могут помочь в решении самых различных задач. В частности, Гугл использует TensorFlow в сервисах распознавания речи, поиске фотографий в Google Photos, создании музыки и в сервисе Smart Reply. Кроме того, TensorFlow можно использовать...
  2. Алгоритмы Machine Learning в Python

    Наиболее распространенными инструментами Data Scientist’а на сегодняшний день являются R и Python. У каждого инструмента есть свои плюсы и минусы, но неплохую позицию по всем параметрам занимает Python. Для Питона есть отлично документированная библиотека Scikit-Learn, в которой реализовано большое количество алгоритмов машинного обучения. Здесь мы остановимся на алгоритмах Machine Learning....
  3. Questions & Answers: Machine Learning & Math

    Machine Learning & Mathematics 1. What is cross-validation? How to do it right? It’s a model validation technique for assessing how the results of a statistical analysis will generalize to an independent data set. Mainly used in settings where the goal is prediction and one wants to estimate how accurately...
  4. Questions & Answers for Data Science

    Here you can find some questions and answers related to Data Science mentioned here. We divided them into 3 parts as follows: Machine Learning & Mathematics Statistics Process & Miscellaneous List of questions you can find here.
  5. Алгоритм Apriori

    Идём дальше в цикле статей Топ-10 data mining алгоритмов и рассматриваем полезный и интересный алгоритм Apriori (Априори). Алгоритм Apriori ищет ассоциативные правила и применяется по отношению к базам данных, содержащим огромное количество транзакций. Что такое ассоциативные правила? Изучение ассоциативных правил – это техника, применяемая в data mining для изучения соотношений...
  6. Метод опорных векторов (SVM)

    Продолжаем цикл статей про Топ-10 data mining алгоритмов. Сегодня у нас на проводе интересный алгоритм дата майнинга — метод опорных векторов. Метод опорных векторов (SVM – Support vector machines) использует гиперплоскость, чтобы классифицировать данные по 2 классам. На верхнем уровне SVM выполняет те же операции, что и C4.5, но с...
  7. Метод k-средних

    Продолжаем описывать популярные алгоритмы из data mining, сегодня остановимся на методе к-средних (k-means). Метод к-средних создает к-групп из набора объектов таким образом, чтобы члены группы были наиболее однородными. Это популярная техника кластерного анализа для исследования набора данных. А что такое кластерный анализ? Кластерный анализ – это семейство алгоритмов, разработанных для...
  8. Алгоритм C4.5

    В статье Топ-10 data mining алгоритмов мы обозначили наиболее популярные алгоритмы дата майнинга. Начинаем с алгоритма C4.5. Алгоритм C4.5 строит классификатор в форме дерева решений. Чтобы сделать это, ему нужно передать набор уже классифицированных данных. А что такое классификатор? Классификатор – это инструмент, применяемый в data mining, который использует классифицированные...
  9. Топ-10 data mining алгоритмов

    Предлагаем вашему вниманию 10 самых эффективных data mining алгоритмов, которые описала группа авторов в докладе «Top 10 algorithms in data mining». Описание этих алгоритмов (в соответствии с оригиналом) будет довольно базовое. В этой статье мы только их перечислим, а их описание будет доступно по ссылкам на названии. Дополнительно мы для...
  10. Машинное обучение на практике

    Нет никаких сомнений в том, что машинное обучение сейчас находится на вершине кривой зрелости технологий, и ответная реакция общества уже тут как тут. И речь идёт не только о футуристических продуктах, вроде Siri и Amazon Echo. Мы говорим не только о компаниях, которые выделяют огромные бюджеты на научно-исследовательские программы (Google,...

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2016-2021 Data Scientist. Все права защищены.