In einem Data Warehouse ist schlechte Datenqualit t ein h ufig auftretendes Problem. Die Erstellung einer Regel zur berpr fung von Merkmalsauspr gungen ist auch unter Verwendung von Expertenwissen aufgrund der Komplexit t zeitaufwendig und fehleranf llig, gerade dann, wenn diese Regel m glichst exakt sein soll. Solche Regeln werden blicherweise durch regul re Ausdrucke dargestellt. In dieser Arbeit werden Regular Expression Learning Verfahren betrachtet und evaluiert, sowie ein Vorgehen konzipiert, um einen regul ren Ausdruck anhand von Beispieldaten automatisch erstellen zu lassen. Der regul re Ausdruck hat den Anspruch durch das Training mit den Beispieldaten die jeweilige Struktur eines Merkmals approximiert zu beschreiben, um Vorhersagen bez glich der Zugeh rigkeit f r unbekannte Merkmalsauspr gungen der jeweiligen Merkmale zu treffen. Abschlie end werden die Evaluationsergebnisse zusammengefasst und es erfolgt eine Empfehlung f r eine Vorgehensweise mittels einer Konzeption und Modifikation zweier vorgestellten Algorithmen. Zus tzlich erfolgt eine prototypischen Umsetzung dieser Konzeption f r einen Algorithmus, sowie exemplarischer Tests anhand dieses Prototyps.
ThriftBooks sells millions of used books at the lowest everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15. ThriftBooks.com. Read more. Spend less.