RE: 多謝樓上二位仁兄的捧場(chǎng),繼續(xù)ing。。
數(shù)據(jù)挖掘解決了什么問(wèn)題? 一、直接問(wèn)題 分類問(wèn)題 根據(jù)事先定義好的類別,對(duì)數(shù)據(jù)進(jìn)行分類。 例如:某銀行根據(jù)用戶信用記錄,對(duì)信用卡、貸款等用戶數(shù)據(jù)進(jìn)行挖掘,區(qū)分 出信用風(fēng)險(xiǎn)分別為高、中、低的三類人群。 類似給你一個(gè)客戶的相關(guān)信息,預(yù)測(cè)一下他未來(lái)一段時(shí)間是否會(huì)不再消費(fèi)?信用度 是好/一般/差?是否會(huì)使用你的某個(gè)商品?將來(lái)會(huì)成為你的高/中/低價(jià)值的客戶? 是否會(huì)響應(yīng)你的某個(gè)促銷活動(dòng)?等等 估值問(wèn)題 把分類的結(jié)果用連續(xù)數(shù)值的方式表示。 例如:某銀行根據(jù)用戶信用記錄,對(duì)信用卡、貸款等用戶數(shù)據(jù)進(jìn)行挖掘,給每 個(gè)用戶進(jìn)行信用評(píng)分(0-1之間)。0.7以上的為高風(fēng)險(xiǎn),0.3以下的為低風(fēng)險(xiǎn)。 預(yù)測(cè)問(wèn)題 用分類或者估值的結(jié)果,估計(jì)將來(lái)會(huì)發(fā)生的情況。 例如:某銀行根據(jù)用戶信用卡消費(fèi)記錄,對(duì)用戶信用卡消費(fèi)記錄進(jìn)行挖掘,預(yù) 測(cè)用戶下一年的信用卡消費(fèi)估值,并提供更好的個(gè)性化服務(wù) 二、間接問(wèn)題 關(guān)聯(lián)問(wèn)題 判斷兩件事情同時(shí)或者順序發(fā)生的可能性。 例如:京東上,客戶買完刻錄光盤后,往往會(huì)購(gòu)買光盤套。 中國(guó)鮮花網(wǎng)上,買鮮花的客戶往往可能會(huì)買花瓶。 聚類問(wèn)題 在沒(méi)有預(yù)先定義類別的情況下,根據(jù)數(shù)據(jù)的自有特征進(jìn)行分類。 例如:購(gòu)買不同類別玩具的用戶,聚類成為不同“亞文化商品”消費(fèi)的人群 可視化和描述問(wèn)題 對(duì)數(shù)據(jù)挖掘的結(jié)果描述。 例如:某B2C商城用戶中,女性人群消費(fèi)的增長(zhǎng)趨勢(shì)高于男性人群的增長(zhǎng)趨勢(shì)
小結(jié):首先有正確的方法,其次才是正確的算法 數(shù)據(jù)挖掘往往是多種不同方法的算法在不同層次的組合 例:商城要針對(duì)老客戶進(jìn)行促銷,首先要通過(guò)聚類區(qū)分客戶群, 其次才是對(duì)應(yīng)不同的客戶群采取不同的預(yù)測(cè)促銷策略。這就是 聚類和分類的綜合應(yīng)用。 該帖于 2010-4-26 9:06:00 被修改過(guò) |