Пропуски в pandas. NaN, pd.NA, None. Часть 1. Определение и проверка

 

В этом видеоуроке я говорю о пропусках в данных (missing values). Чаще всего пропуски в данных представлены в виде значений NaN (not a number). Это такое специальное значение библиотеки numpy, обозначающее отсутствие числа с типом данных float. Но есть и другие значения, которые так же рассматриваются как пропущенные значения. 00:00 | О пропусках данных в работе аналитика 05:19 | Какими бывают пропущенные значения? NaN, None, pd.NA 08:22 | Правила преобразований типа данных в серии, содержащей пропуск 10:06 | NaN не равен самому себе 10:36 | Функции для проверки пропусков (pd.isnull, pd.notna, np.isnan etc.) 11:51 | pd.NA - экспериментальный нулевой объект для массивов с типом данных int 12:35 | Строка не считается пропущенным значением 13:07 | Используем replace для замены строковых значений на пропуски NaN 14:15 | Функции для чтения файлов по умолчанию считают ряд значений как NaN 15:57 | Параметр na_values функции pd.read_csv 16:29 | Параметр keep_default_na функции pd.read_csv 16:58 | Параметр na_filter функции pd.read_csv 17:15 | Вывод. Какие значения считаются отсутствующими 17:36 | Заключение Ставь ЛАЙК, если считаешь это видео полезным, и тогда его увидят другие :) Поддержать автора на boosty -