Pojem
"data mining" ( DM ) v názvu knihy působí poněkud
podivně. Přitahuje čtenáře, kteří vědí o co v data
miningu jde a paradoxně odpuzuje právě ty, kdo by se s
ním měli, mohli nebo chtěli seznámit. Význam českého
slova "dolování" řada lidí vnímá jinak, než odpovídá
anglickému originálu mining. I já bych asi uvítal spíš
pojem "vytěžování", než dolování, jelikož podstatnou
částí procesu data miningu je
datové
modelování.
Z pojetí knihy DM je zřejmé, že
jde více
o to "dolovat z dat" než o "dolování dat".
Autorka charakterizuje
proces
DM fázemi:
- příprava dat pro modelování
- výběr a transformace proměnných
- zpracování a vyhodnocení modelu
- ověření modelu
- implementace a údržba modelu.
Autorka charakterizuje obecný cíl DM jako snahu o
sloučení různých rozsáhlých a často nekompatibilních
dat do systému - modelu umožňujícího odhalení vztahů
mezi daty.
Podtitulek knihy naznačuje, že metody a techniky DM
jsou v knize spojovány s oblastí CRM. Výrazem tohoto
pojetí obsahu knihy je
zaměření
vybraných kapitol
knihy na:
- profilaci a segmentaci
- modelování odezvy
- modelování rizika
- model pravděpodobnosti odchodu zákazníků
- model LTV ( Long Time Value ) - hodnota produktu po
dobu jeho existence.
Kniha se soustřeďuje na osvojení praktických znalostí
potřebných pro využívání moderních technik modelování
dat ve světě marketingu, rizika a řízení vztahů se
zákazníky ( CRM ). Autorka vychází z poznání, že
úspěch
jakéhokoliv modelovacího projektu vyžaduje nejen
dostatečné porozumění metodologiím, ale také dobrou
znalost dat, trhu a celkových obchodních cílů.
DM představuje širokou škálu technik a metod
používaných v
celé
řadě dalších odvětví.
Patří k nim pojišťovnictví, investiční bankovnictví,
veřejné služby, telekomunikace, zásilkové služby,
energetika, maloobchod, cestovní ruch, atd.
Autorka se cílevědomě snaží podat látku DM tak, aby
byla aplikovatelná v reálném životě firmy / instituce.
Hnacím
motorem DM je profitabilita.
V souladu s tím autorka akcentuje zaměření na
segmentaci a profilaci zákazníků a maximalizaci
efektivnosti direct-marketingu. Během své pedagogické
praxe jsem se setkal s dvěma extrémy: na jedné straně
dobrá znalost obsahových otázek aplikační oblasti
provázená podceňováním exaktních metod a moderních
technik, na straně druhé vysoká znalost moderních
exaktních metod provázená potížemi při interpretaci
výsledků jejich aplikace.
Velice
si vážím praktického přístupu autorky
knihy DM právě proto, že vychází ze snahy o spojení
obsahových poznatků zvolené aplikační sféry s metodami
DM. Pokud jste se začetli do této mé recenze a
zvažujete zda investovat či neinvestovat čas do
studia obsahu knihy, odpovězte si na otázku:
"potřebuji zhodnotit svá data ve prospěch firmy?".
Plnému pochopení obsahu knihy prospěje znalost základů
statistiky a zdravý podnikatelský úsudek. Základní
znalosti o metodách statistického a analytického
modelování a znalost jazyka systému SAS studium knihy
velmi usnadní.
Kniha poslouží analytikům, pracovníkům v oblasti DM a
marketingovým manažérům. Je škoda, že při překladu
názvu knihy bylo vypuštěno slovo "kuchařka". Vyjadřuje
dobře praktické zaměření textu a dodávalo by více
odvahy začátečníkům. Kniha obsahuje celou řadu
praktických rad a tipů od renomovaných expertů v
oblasti DM. Každá kapitola končí stručným souhrnem
poznatků. Obsahuje
řadu
případových studií,
z nichž hlavní provází výklad v několika kapitolách
knihy - především základními fázemi práce s datovým
modelem. Příklady jsou postaveny na využití procedury
pro logistickou regresi a programovány jsou v jazyce
systému SAS. Kniha poslouží jako
všestranný průvodce všemi fázemi procesu DM
především pro ty, kdo se s DM setkávají poprvé. Pro
zkušenější
analytiky
poslouží kniha jako užitečná reference.
Manažéři
získají přečtením knihy základní ponětí o dovednostech
a postupech nezbytných pro úspěšnou aplikaci datových
modelů. Věřím tomu, že kniha DM pomůže dobře pokrýt
rostoucí poptávku po vzdělaných analyticích a
odbornících na dolování dat. Podle této knihy se
čtenáři naučí připravovat velmi výkonné datové modely
ve velmi krátkém čase.
.......................................................................................................................................
Nedílnou součástí knihy je
přiložený CD-ROM.
Obsahuje
vzorové
databáze a demoverze dvou programů.
Vzorová data jsiou doplněna podrobnými popisy
jednotlivých proměnných. Program JMP obsahuje řadu
funkcí pro interaktivní statistickou analýzu dat.
Program DATAFLUX představuje nástroj pro čištění,
standardizaci, ověřování a integraci dat z
nejrůznějších databází. Na CD jsou uvedeny i
popisy obou programů společně s ukázkovými příklady.
Nabízený kód může sloužit v roli samostatné modelovací
šablony , jelikož kroky probíhající před a po procesu
modelování lze aplikovat v jakémkoliv balíku pro
datové modelování.
do. Arnošt Katolický, 25. 2. 2002. |