Какво е комплект за изчакване? Понякога наричано „тестване“данни, подмножество за задържане предоставя окончателна оценка на производителността на модела за машинно обучение, след като е бил обучен и валидиран. Наборите за изчакване никога не трябва да се използват за вземане на решения кои алгоритми да се използват или за подобряване или настройка на алгоритми.
Кръстосаното валидиране по-добро ли е от задържането?
Кръстосаната валидация обикновено е предпочитаният метод, тъй като дава на вашия модел възможност да тренира на множество разделяния на тест за влак. Това ви дава по-добра индикация за това колко добре ще се представи вашият модел върху невидими данни. Задържането, от друга страна, зависи само от едно разделяне на теста за влак.
Какво е задържащ подход?
Holdout Method е най-простият вид метод за оценка на класификатор. При този метод наборът от данни (колекция от елементи от данни или примери) се разделя на два набора, наречени набор за обучение и набор от тестове. Класификаторът изпълнява функцията на присвояване на елементи от данни в дадена колекция към целева категория или клас.
Трябва ли винаги да правя кръстосано валидиране?
По принцип кръстосаното валидиране е винаги е необходимо, когато трябва да определите оптималните параметри на модела, за логистична регресия това би бил параметърът C.
Какво е предимството на кръстосаното валидиране на K-fold?
ако сравните тест-MSEs са по-добри в случай на k-кратно CV от LOOCV. k-fold CV или други CV или методи за повторно вземане на проби неподобряване на тестовите грешки. те оценяват тестовите грешки. в случай на k-fold, той върши по-добра работа за оценка на грешката от LOOCV.