Kann jemand erklären, was der Unterschied zwischen Klassifizierung und Clustering beim Data Mining ist?
Wenn ja, geben Sie bitte Beispiele für beides, um den Grundgedanken zu verstehen.
Im Allgemeinen haben Sie bei der Klassifizierung eine Reihe von vordefinierten Klassen und möchten wissen, zu welcher Klasse ein neues Objekt gehört.
Beim Clustering wird versucht, eine Reihe von Objekten zu gruppieren und herauszufinden, ob es eine Beziehung zwischen den Objekten gibt.
Im Kontext des maschinellen Lernens ist Klassifizierung überwachtes Lernen und Clustering ist unüberwachtes Lernen.
Schauen Sie sich auch Klassifikation und Clustering bei Wikipedia an.
+Klassifizierung: Sie erhalten einige neue Daten, für die Sie eine neue Bezeichnung festlegen müssen.
Ein Beispiel: Ein Unternehmen möchte seine potenziellen Kunden klassifizieren. Wenn ein neuer Kunde kommt, muss er feststellen, ob es sich um einen Kunden handelt, der seine Produkte kaufen wird oder nicht.
+Clustering: Man erhält einen Satz historischer Transaktionen, die aufzeichnen, wer was gekauft hat.
Mit Hilfe von Clustering-Techniken können Sie die Segmentierung Ihrer Kunden erkennen.
Ich bin ein Neuling auf dem Gebiet des Data Mining, aber wie in meinem Lehrbuch steht, soll CLASSICIATION überwachtes Lernen und CLUSTERING unüberwachtes Lernen sein. Der Unterschied zwischen überwachtem Lernen und unüberwachtem Lernen kann hier nachgelesen werden.