有人問集體智慧編程(中文版)這本書到底適合什么人來閱讀?有讀者是這樣說的——這本書很適合數(shù)學基礎不算太好(當然也還是要一定的數(shù)學基礎),又想了解數(shù)據(jù)挖掘這個領域的讀者。或者有實際的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。那么這本書到底好不好呢?有人這樣評價這本書——此書重于實踐,從源代碼中也能看懂各章的知識,可以說,讀了此書,會對人工智能有個更深入的認識。另外,在豆瓣上這本書更是獲得9分的好評,所以說,如此好的一本書,你有什么理由錯過呢?點擊本文相應的下載地址進行下載,你將會獲得一份pdf格式高清免費版集體智慧編程(中文版)電子書,歡迎大家前來下載查閱!
集體智慧編程(中文版)目錄
Table of Contents
前言viii
第1章 集體智慧導言1
什么是集體智慧2
什么是機器學習3
機器學習的局限4
真實生活中的例子5
學習型算法的其他用途5
第2章 提供推薦7
協(xié)作型過濾7
搜集偏好8
尋找相近的用戶9
推薦物品15
匹配商品17
構建一個基于del.icio.us的鏈接推薦系統(tǒng)19
基于物品的過濾22
使用MovieLens數(shù)據(jù)集25
基于用戶進行過濾還是基于物品進行過濾27
練習28
第3章 發(fā)現(xiàn)群組29
監(jiān)督學習和無監(jiān)督學習29
單詞向量30
分級聚類33
繪制樹狀圖38
列聚類40
K-均值聚類42
針對偏好的聚類44
以二維形式展現(xiàn)數(shù)據(jù)49
有關聚類的其他事宜53
練習53
第4章 搜索與排名54
搜索引擎的組成54
一個簡單的爬蟲程序56
建立索引58
查詢63
基于內(nèi)容的排名64
利用外部回指鏈接69
從點擊行為中學習74
練習84
第5章 優(yōu)化86
組團旅游87
描述題解88
成本函數(shù)89
隨機搜索91
爬山法92
模擬退火算法95
遺傳算法97
真實的航班搜索101
涉及偏好的優(yōu)化106
網(wǎng)絡可視化110
其他可能的應用場合115
練習116
第6章 文檔過濾117
過濾垃圾信息117
文檔和單詞118
對分類器進行訓練119
計算概率121
樸素分類器123
費舍爾方法127
將經(jīng)過訓練的分類器持久化132
過濾博客訂閱源134
對特征檢測的改進136
使用Akismet138
替代方法139
練習140
第7章 決策樹建模142
預測注冊用戶142
引入決策樹144
對樹進行訓練145
選擇最合適的拆分方案147
以遞歸方式構造樹149
決策樹的顯示151
對新的觀測數(shù)據(jù)進行分類153
決策樹的剪枝154
處理缺失數(shù)據(jù)156
處理數(shù)值型結果158
對住房價格進行建模158
對“熱度”評價進行建模161
什么時候使用決策樹164
練習165
第8章 構建價格模型167
構造一個樣本數(shù)據(jù)集167
k-最近鄰算法169
為近鄰分配權重172
交叉驗證176
不同類型的變量178
對縮放結果進行優(yōu)化181
不對稱分布183
使用真實數(shù)據(jù)——eBay API189
何時使用k-最近鄰算法195
練習196
第9章 高階分類:核方法與SVM197
婚介數(shù)據(jù)集197
數(shù)據(jù)中的難點199
基本的線性分類202
分類特征205
對數(shù)據(jù)進行縮放處理209
理解核方法211
支持向量機215
使用LIBSVM217
基于Facebook的匹配219
練習225
第10章 尋找獨立特征226
搜集一組新聞227
先前的方法231
非負矩陣因式分解232
結果呈現(xiàn)240
利用股票市場的數(shù)據(jù)243
練習248
第11章 智能進化250
什么是遺傳編程250
將程序以樹形方式表示253
構造初始種群257
測試題解259
對程序進行變異260
交叉263
構筑環(huán)境265
一個簡單的游戲268
更多可能性273
練習276
第12章 算法總結277
貝葉斯分類器277
決策樹分類器281
神經(jīng)網(wǎng)絡285
支持向量機289
k-最近鄰293
聚類296
多維縮放300
非負矩陣因式分解302
優(yōu)化304
附錄A:第三方函數(shù)庫309
附錄B:數(shù)學公式316
索引323
集體智慧編程電子書內(nèi)容簡介
本書以機器學習與計算統(tǒng)計為主題背景,專門講述如何挖掘和分析Web上的數(shù)據(jù)和資源,如何分析用戶體驗、市場營銷、個人品味等諸多信息,并得出有用的結論,通過復雜的算法來從Web網(wǎng)站獲取、收集并分析用戶的數(shù)據(jù)和反饋信息,以便創(chuàng)造新的用戶價值和商業(yè)價值。全書內(nèi)容翔實,包括協(xié)作過濾技術(實現(xiàn)關聯(lián)產(chǎn)品推薦功能)、集群數(shù)據(jù)分析(在大規(guī)模數(shù)據(jù)集中發(fā)掘相似的數(shù)據(jù)子集)、搜索引擎核心技術(爬蟲、索引、查詢引擎、PageRank算法等)、搜索海量信息并進行分析統(tǒng)計得出結論的優(yōu)化算法、貝葉斯過濾技術(垃圾郵件過濾、文本過濾)、用決策樹技術實現(xiàn)預測和決策建模功能、社交網(wǎng)絡的信息匹配技術、機器學習和人工智能應用等。
本書是Web開發(fā)者、架構師、應用工程師等的絕佳選擇。
集體智慧編程(中文版)內(nèi)容截圖
- PC官方版
- 安卓官方手機版
- IOS官方手機版