Сигмо́ида (также сигмо́ид) — это гладкая монотонная возрастающая нелинейнаяфункция, имеющая форму буквы «S», которая часто применяется для «сглаживания» значений некоторой величины.
Сигмоида ограничена двумя горизонтальными асимптотами, к которым стремится при стремлении аргумента к . В зависимости от соглашения, этими асимптотами могут быть y = ±1 (в ) либо y = 0 в и y = +1 в .
Производная сигмоиды представляет собой колоколообразную кривую с максимумом в нуле, асимптотически стремящуюся к нулю в .
Семейство функций класса сигмоид
Сравнение некоторых сигмоидных функций, нормализованных таким образом, чтобы производная в начале координат была равна 1
Сигмоиды применяются в нейронных сетях в качестве функций активации. Они позволяют нейронам как усиливать слабые сигналы, так и не насыщаться от сильных сигналов[1].
В нейронных сетях часто используются сигмоиды, производные которых могут быть выражены через саму функцию. Это позволяет существенно сократить вычислительную сложность метода обратного распространения ошибки, сделав его применимым на практике:
— для гиперболического тангенса;
— для логистической функции.
Логистическая регрессия
Логистическая функция используется в решении задач классификации с использованием логистической регрессии. Пусть решается задача классификации с двумя классами ( и , где — переменная, указывающая класс объекта). Делается предположение о том, что вероятность принадлежности объекта к одному из классов выражается через значения признаков этого объекта (действительные числа):
Именно такая функция получается при использовании обобщённой линейной модели и предположения, что зависимая переменная распределена по закону Бернулли.
См. также
Искусственная нейронная сеть
Перцептрон
Модифицированный гиперболический тангенс
Литература
Mitchell, Tom M.Machine Learning. — WCB–McGraw–Hill, 1997. — ISBN 0-07-042807-7.