Удаление выбросов в данных с помощью boxplot в R

Наличие выбросов в данных часто искажает результаты анализа и может привести к неблагоприятным последствиям. Существует несколько методов обнаружения выбросов в данных и избавления от них. Предлагаем рассмотреть один из простых методов с использованием особенностей функции boxplot в R.

Предположим, что у нас есть 2 набора данных, в которых наблюдаются выбросы. Мы их идентифицируем графическим методом и удалим из нашего набора. Вот код R:

А вот и видео:

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2016-2021 Data Scientist. Все права защищены.