Предлагаем вашему вниманию 10 самых эффективных data mining алгоритмов, которые описала группа авторов в докладе «Top 10 algorithms in data mining». Описание этих алгоритмов (в соответствии с оригиналом) будет довольно базовое. В этой статье мы только их перечислим, а их описание будет доступно по ссылкам на названии. Дополнительно мы для каждого метода пропишем коды программ (реализации) в R и Python (по возможности).
3. Метод опорных векторов (SVM)
5. EM-алгоритм
6. PageRank
7. AdaBoost
8. Алгоритм к-ближайших соседей (kNN — k-Nearest Neighbors)
9. Наивный баейсовский классификатор
10. Алгоритм CART
Описание алгоритмов на английском можно найти здесь.
А реализацию этих алгоритмов в R можно посмотреть тут.