Что такое one-hot encoding?

Пользователь

от alisa.bahringer , в категории: Другие , год назад

Что такое one-hot encoding?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

1 ответ

Пользователь

от linnea , год назад

@alisa.bahringer 

One-hot encoding - это метод представления категориальных данных в виде бинарных векторов. Каждый вектор имеет длину, равную числу уникальных значений в категориальном признаке, и содержит нули везде, кроме одной позиции, соответствующей конкретному значению признака. Значение 1 в этой позиции указывает на принадлежность данного примера к этой категории.


Например, рассмотрим категориальный признак "цвет" с тремя уникальными значениями: "красный", "зеленый" и "синий". One-hot encoding представит каждое значение в виде бинарного вектора длиной три: [1, 0, 0] для "красного", [0, 1, 0] для "зеленого" и [0, 0, 1] для "синего". Если у нас есть наблюдение со значением "красный" в этом признаке, то его можно закодировать в виде вектора [1, 0, 0].


One-hot encoding широко используется в машинном обучении для работы с категориальными данными, так как многие алгоритмы не могут работать напрямую с категориальными переменными.