《數(shù)據(jù)挖掘技術落地實踐》課程詳情
點擊下載課大綱及報名表
課程簡介
數(shù)據(jù)挖掘和機器學習是屬于大數(shù)據(jù)的核心技術之一,以科學嚴謹?shù)臄?shù)據(jù)依據(jù)幫助企業(yè)做分析決策,同時其高深的理論門檻也阻擋了廣大工程師的學習上手,在大數(shù)據(jù)時代,如何進行基于海量數(shù)據(jù)在成百上千的機器進行分布式數(shù)據(jù)挖掘更是需要解決的難題,本課程從實戰(zhàn)角度出發(fā),基于企業(yè)實際需求,深入淺出的講解數(shù)據(jù)挖掘最常用的算法和企業(yè)場景,讓工程師通俗易懂的掌握,并且進行編程落地實踐培訓,讓抽象的算法公式完全落地工程化為企業(yè)所用。
課程大綱
一、大數(shù)據(jù)分析挖掘技術介紹
1、map/reduce
2、mahout數(shù)據(jù)挖掘
3、sql on hadoop
4、spark生態(tài)體系
5、R語言
6、MPI并行計算
7、GPU并行計算(深度學習)
8、fourinone并行計算
二、常用機器學習算法原理
1、決策樹
2、隨機森林
3、協(xié)同過濾推薦算法
4、樸素貝葉斯算法
5、k-means聚類算法
6、pagerank算法
7、邏輯回歸
三、大數(shù)據(jù)挖掘業(yè)務場景和生產(chǎn)平臺
1、互聯(lián)網(wǎng)金融業(yè)務
2、銀行客戶需求業(yè)務
3、大數(shù)據(jù)分析生產(chǎn)平臺
四、編程實踐
1、迭代類機器學習編程入門-求圓周率
2、pagerank的并行化實現(xiàn)(*)
3、邏輯回歸算法的java實現(xiàn)(*)
4、決策樹c45,id3的java實現(xiàn)
5、隨機森林和全樹并行化實現(xiàn)
6、訓練數(shù)據(jù)和結果模擬器
7、模型結果規(guī)則化處理
課程對象
初中級基礎的工程師,數(shù)據(jù)分析/挖掘/大數(shù)據(jù)技術人員,企業(yè)數(shù)據(jù)建模/決策人員等等
《數(shù)據(jù)挖掘技術落地實踐》所屬分類
研發(fā)項目
《數(shù)據(jù)挖掘技術落地實踐》所屬專題
excel培訓、
《數(shù)據(jù)挖掘技術落地實踐》授課培訓師簡介
木巖
(現(xiàn)為知名企業(yè)中間件首席架構師)
擅長領域
研發(fā)管理
職業(yè)背景
現(xiàn)任某知名IT企業(yè)中間件首席架構師,前淘寶高級專家。先后在淘寶交易、淘寶中間件、集團核心系統(tǒng)、阿里金融等部門工作。曾任金蝶總體架構部SOA架構師,負責設計ESB。曾艱苦創(chuàng)業(yè),編寫和銷售財務軟件。
在Java技術領域從業(yè)十多年,撰寫過多款開源軟件,其中,淘寶分布式技術框架Fourinone為其代表作。他擁有軟件著作權的代表作有:BS系列軟件(包括財務進銷存、OA產(chǎn)品、CRM等)、FMS視頻會議、Flash網(wǎng)站生成軟件(華軍可下載),所有軟件作品均貢獻99%代碼。
作品:
CoolHash數(shù)據(jù)庫引擎
出版書籍:《大規(guī)模分布式系統(tǒng)架構與設計實戰(zhàn)》