<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>»Me, myself und BI« &#187; Datenmusterkennung</title>
	<atom:link href="http://blog.bissantz.de/index.php/tag/datenmusterkennung/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.bissantz.de</link>
	<description>Bissantz denkt nach</description>
	<lastBuildDate>Wed, 25 Jan 2012 11:54:38 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Goldgrube oder Grubenungl&#252;ck?</title>
		<link>http://blog.bissantz.de/data-mining-2009</link>
		<comments>http://blog.bissantz.de/data-mining-2009#comments</comments>
		<pubDate>Fri, 20 Mar 2009 20:45:08 +0000</pubDate>
		<dc:creator>Dr. Nicolas Bissantz</dc:creator>
				<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[Analyse]]></category>
		<category><![CDATA[Data Mining]]></category>
		<category><![CDATA[Datenmodellierung]]></category>
		<category><![CDATA[Datenmusterkennung]]></category>
		<category><![CDATA[Entscheidungsheuristik]]></category>
		<category><![CDATA[Marketing]]></category>
		<category><![CDATA[Mustererkennung]]></category>
		<category><![CDATA[Regeln]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Wirtschaftsinformatik]]></category>
		<category><![CDATA[ZEIT]]></category>

		<guid isPermaLink="false">http://blog.bissantz.de/?p=1222</guid>
		<description><![CDATA[Die Erwartungen an das Data Mining waren hoch: Neue Methoden sollten die in Datenbanken verborgenen Erkenntnisschätze automatisch heben. Anlässlich der Aufnahme eines frühen Artikels zu diesem Thema ins "Best of" der Zeitschrift für Wirtschaftsinformatik blicken wir zurück auf 16 Jahre Data Mining.]]></description>
			<content:encoded><![CDATA[<p><strong>Die Wirtschaftsinformatik hat in ihren Archiven gesch&uuml;rft und den Artikel &#8222;Data Mining&#8220; von 1993 neu abgedruckt. Wir sagen danke und fassen zusammen, was wir in den 16 Jahren seitdem &uuml;ber Datenmustererkennung gelernt haben.</strong></p>
<p>Die <a href="http://www.wirtschaftsinformatik.de/" target="zwi">Zeitschrift Wirtschaftsinformatik</a> feiert ihr 50-j&auml;hriges Bestehen. Aus diesem Anlass hat sie ihre Archive durchgesehen und im Sinne eines &bdquo;Best of&ldquo; eine Handvoll Artikel ausgew&auml;hlt, um sie in der <a href="http://www.wirtschaftsinformatik.de/index.php;do=wi_ah/site=wi/sid=9b350e4ffad7b6e7a2fdd521e281daa2/ed=2009-01-01/sid=c0cb92629cbb8b4dd609919c98b59821" target="zwi">Jubil&auml;umsausgabe</a> noch einmal abzudrucken. Der von Dr. J&uuml;rgen Hagedorn und mir verfasste Beitrag &bdquo;Data Mining (Datenmusterkennung)&ldquo; von 1993 hat es unverhofft in diese Auswahl geschafft. Der Aufsatz entstand in unserer gemeinsamen Zeit als Assistenten am Lehrstuhl von <a href="http://blog.bissantz.de/peter-mertens">Prof. Peter Mertens</a>, J&uuml;rgen ist heute bei SAP.</p>
<div style="height: 320px;"><img style="float: left; margin-right: 10px;" src="/images/Telmex-Rechnung2.png" alt="Rechnung von Telmex" width="250" height="313" /></p>
<p class="gray">&#8222;One-to-One&#8220;-Marketing durch Data Mining bei der mexikanischen Telmex. Der Rechner bestimmt, wer welche Werbeanzeigen auf seine Telefonrechnung gedruckt bekommt. Die Konversionsraten stiegen dadurch stark an.</p>
</div>
<p>Der Hype um die Datenmustererkennung ist vorbei. Die Disziplin reift, befreit von <a href="http://blog.bissantz.de/mythos-data-mining">falschen Erwartungen</a>. Die Schlagzeilen sind anderen Sujets gewidmet. Wie steht es um das Data Mining? Was hat sich inzwischen getan? Die Erfahrungen, die wir &uuml;ber alle Branchen und Wirtschaftszweige hinweg in den letzten 16 Jahren sammeln konnten, zeigen so viel:</p>
<hr />
<ol>
<li><strong>Ostereier-Paradoxon</strong> Die M&ouml;glichkeiten und Grenzen der Datenmustererkennung haben Bestand. Der albtraumhafte Automationsgrad, von dem man damals fabulierte, ist auch heute noch in weiter Ferne. Wir haben es damals als Ostereier-Paradoxon so formuliert: Die Erkenntnisse, die man zu gewinnen hofft, muss man zuvor durch geschickte Datenmodellierung und Methodenauswahl selbst verstecken. Es lohnt also immer noch, Unternehmen von Menschen f&uuml;hren zu lassen.</li>
<li><strong>Maschinelle Prozesshoheit</strong> Ab einem bestimmten Punkt in der Prozesskette des Data Mining ist der menschliche Eingriff unerw&uuml;nscht: Kaum ein Anwender zeigt je die Disziplin, sich an die Ergebnisse eines Data-Mining-Systems zu halten. L&auml;sst man etwa einen Algorithmus wie unseren Selector bestimmen, welche Adressen in einer Direktmarketingaktion angeschrieben werden sollen, so muss man sich an den Vorschlag halten, wenn man anschlie&szlig;end die G&uuml;te der Auswahl messen will. Wo das gelingt, gibt es auch nachweisbare Erfolge.</li>
<li><strong>Automation der Routine</strong> Schnelle Erfolge stellen sich immer dann ein, wenn es gelingt, sich wiederholende Analyseaufgaben an den Rechner zu delegieren. Voraussetzung ist, man findet Rechenvorschriften f&uuml;r menschliche Entscheidungsheuristiken. Die Maschine tut, was der Mensch auch tun w&uuml;rde &ndash; wenn er denn unendlich Zeit daf&uuml;r h&auml;tte und die sehr billig w&auml;re. Beispiele sind das Suchen nach Abweichungsursachen in Betriebsergebnishierarchien oder das Segmentieren von M&auml;rkten nach soziodemografischen Merkmalen.</li>
<li><strong>Strukturarmut</strong> Eine Vermutung best&auml;tigte sich &uuml;ber die Jahre immer wieder: Schlimmer als unsaubere Daten ist ein Mangel an Struktur. Dennoch wird der Beseitigung von Datenschmutz die gr&ouml;&szlig;ere Aufmerksamkeit gewidmet. Das ist nicht zielf&uuml;hrend. Es behindert die Mustererkennung wenig, wenn ein Teil der Kunden der falschen Branche zugeordnet ist. Hingegen verhindert es jede Erkenntnis &uuml;ber Branchenmuster, wenn es gar keine Zuteilung gibt.</li>
<li><strong>Datenknappheit</strong> F&uuml;r analytische Zwecke herrscht trotz der &uuml;berall beschworenen Datenfluten in den Unternehmen eher Datenarmut. Gewaltige Aufwendungen f&uuml;r operative IT-Systeme sind kein Garant f&uuml;r analytisch brauchbare Daten. Wenn die Damen und Herren in der Auftragsannahme immer 9999 eintippen, anstatt den Kunden die passenden Angaben zu entlocken, sitzt man nach Jahren auf vielen, aber nichtssagenden Daten. Diese Erkenntnis entmutigt viele, bevor sie richtig angefangen haben. Schade, denn die L&ouml;sung liegt nahe und ist billig: Man erhebt die ben&ouml;tigten Daten neu, in Form einer Stichprobe.</li>
<li><strong>Managementtauglichkeit</strong> Die gr&ouml;&szlig;ten Fortschritte und die gr&ouml;&szlig;te Befriedigung fanden wir immer dort, wo es gelang, die Managementtauglichkeit von Analyseverfahren zu erh&ouml;hen. Software zur Assoziation, mit der man Warenkorbanalysen anstellt, gibt es inzwischen viel. Die einzige, die die typischerweise riesige Zahl an Regeln auf eine handhabbare und verst&auml;ndliche Anzahl reduziert, stammt meines Wissens von uns.</li>
</ol>
<p>Auf eine Goldgrube zu sto&szlig;en, gelingt nicht immer. Grubenungl&uuml;cke jedoch lassen sich leicht vermeiden, und einige Nuggets sind rasch gefunden.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.bissantz.de/data-mining-2009/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

