1. Экспорт результатов из R в Word

    По тем или иным причинам нам часто нужно экспортировать результаты нашего анализа, проведённого в R (таблицы, графики и т.п.) в текстовый редактор MS Word. Есть несколько методов, вот один из них. Рассматривается пример экспорта результатов регрессионного анализа в Ворд. Get the results from Cox Regression Analysis As an example to...
  2. Очищаем данные от NA в R

    Чистыми данные бывают только в учебниках, а в реальных данных, помимо всего прочего, встречаются потерянные/отсутствующие значения (NA). C помощью R можно легко от них избавиться. Итак, рассмотрим простой случай: [crayon-660663e7726ce968328866/] В случае с несколькими векторами: [crayon-660663e7726d5548891137/] В случае с таблицей данных (на примере встроенного набора данных): [crayon-660663e7726da364823329/]
  3. Расчёт памяти для обработки данных в R

    Если мы имеем дело с относительно большой таблицей данных (с миллионами строк) и обрабатываем эти данные в R, то следует принимать во внимание тот факт, что памяти компьютера может не хватить. Предлагаем рассмотреть грубую схема расчёта необходимой памяти компьютера для обработки данных в R. Для начала нужно узнать параметры системы:...
  4. Удаление выбросов в данных с помощью boxplot в R

    Наличие выбросов в данных часто искажает результаты анализа и может привести к неблагоприятным последствиям. Существует несколько методов обнаружения выбросов в данных и избавления от них. Предлагаем рассмотреть один из простых методов с использованием особенностей функции boxplot в R. Предположим, что у нас есть 2 набора данных, в которых наблюдаются выбросы....
  5. Проверка на нормальность

    Тестирование данных на нормальность часто является первым этапом их анализа, так как большое количество статистических методов исходит из предположения нормальности распределения изучаемых данных. Например, пусть необходимо проверить гипотезу о равенстве средних значений в двух независимых выборках. Для этой цели подходит критерий Стьюдента. Но применение критерия Стьюдента обосновано, только если данные...
  6. Собираем веб-данные с помощью R

    Для того чтобы принять участие в сборе данных, вам понадобится иметь в арсенале серьезное оружие. Cначала проверьте, установлено ли у вас R (программное обеспечение для статистических вычислений) и RStudio (среда разработки программного обеспечения для языка программирования R). Исследуем базы данных команды NBA с сайта Basketball Reference. Посмотрим на сезон 2013-2014....
  7. Установка R и R Studio

    Для анализа данных нам понадобятся бесплатные средства обработки данных — мы будем использовать R, R Studio и Python (Питон). Смотрим откуда их брать:

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2016-2021 Data Scientist. Все права защищены.