|
Die Leave-One-Out Kreuzvalidierung ist ein Testverfahren zur Messung der Güte von Algorithmen und Methoden
aus dem Data Mining.
Im Gegensatz zur einfachen Kreuzvalidierung, ist bei der
Leave-One-Out Kreuzvalidierung (engl. leave-one-out cross validation) das k=N. Somit werden N
Durchläufe gestartet und deren Einzelfehlerwerte ergeben als Mittelwert die
Gesamtfehlerrate.
Nachteil dieser Methode ist, dass keine Stratifizierung der Teilmengen, wie bei der stratifizierten Kreuzvalidierung mehr möglich ist. Dadurch kann es in Extremfällen dazu
kommen, dass dieses Testverfahren falsche Fehlerwerte liefert. Beispiel: Eine vollständig zufällige Datenmenge bei gleichmäßiger
Verteilung und nur zwei Klassen würde zu einem LOO-CV von 100% Prozent führen. Warum? Aus N Instanzen werden zum
Training N/2 Instanzen der Klasse K1 verwendet und N/2-1 Instanzen der Klasse K2. Da der
Klassifikator immer die Mehrheitsklasse der Testdaten prognostiziert, liefert der Test mit der Testinstanz der Klasse K2
einen Fehler von 100%!
Ein weitere Nachteil ist der sehr hohe Rechenaufwand.
siehe auch: Kreuzvalidierungsverfahren
|