目 錄
第1章 好的推薦係統 1
1.1 什麼是推薦係統 1
1.2 個性化推薦係統的應用 4
1.2.1 電子商務 4
1.2.2 電影和視頻網站 8
1.2.3 個性化音樂網絡電颱 10
1.2.4 社交網絡 12
1.2.5 個性化閱讀 15
1.2.6 基於位置的服務 16
1.2.7 個性化郵件 17
1.2.8 個性化廣告 18
1.3 推薦係統評測 19
1.3.1 推薦係統實驗方法 20
1.3.2 評測指標 23
1.3.3 評測維度 34
第2章 利用用戶行為數據 35
2.1 用戶行為數據簡介 36
2.2 用戶行為分析 39
2.2.1 用戶活躍度和物品流行度的分布 39
2.2.2 用戶活躍度和物品流行度的關係 41
2.3 實驗設計和算法評測 41
2.3.1 數據集 42
2.3.2 實驗設計 42
2.3.3 評測指標 42
2.4 基於鄰域的算法 44
2.4.1 基於用戶的協同過濾算法 44
2.4.2 基於物品的協同過濾算法 51
2.4.3 UserCF和ItemCF的綜閤比較 59
2.5 隱語義模型 64
2.5.1 基礎算法 64
2.5.2 基於LFM的實際係統的例子 70
2.5.3 LFM和基於鄰域的方法的比較 72
2.6 基於圖的模型 73
2.6.1 用戶行為數據的二分圖錶示 73
2.6.2 基於圖的推薦算法 73
第3章 推薦係統冷啓動問題 78
3.1 冷啓動問題簡介 78
3.2 利用用戶注冊信息 79
3.3 選擇閤適的物品啓動用戶的興趣 85
3.4 利用物品的內容信息 89
3.5 發揮專傢的作用 94
第4章 利用用戶標簽數據 96
4.1 UGC標簽係統的代錶應用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 標簽係統中的推薦問題 100
4.2.1 用戶為什麼進行標注 100
4.2.2 用戶如何打標簽 101
4.2.3 用戶打什麼樣的標簽 102
4.3 基於標簽的推薦係統 103
4.3.1 實驗設置 104
4.3.2 一個最簡單的算法 105
4.3.3 算法的改進 107
4.3.4 基於圖的推薦算法 110
4.3.5 基於標簽的推薦解釋 112
4.4 給用戶推薦標簽 115
4.4.1 為什麼要給用戶推薦標簽 115
4.4.2 如何給用戶推薦標簽 115
4.4.3 實驗設置 116
4.4.4 基於圖的標簽推薦算法 119
4.5 擴展閱讀 119
第5章 利用上下文信息 121
5.1 時間上下文信息 122
5.1.1 時間效應簡介 122
5.1.2 時間效應舉例 123
5.1.3 係統時間特性的分析 125
5.1.4 推薦係統的實時性 127
5.1.5 推薦算法的時間多樣性 128
5.1.6 時間上下文推薦算法 130
5.1.7 時間段圖模型 134
5.1.8 離綫實驗 136
5.2 地點上下文信息 139
5.3 擴展閱讀 143
第6章 利用社交網絡數據 144
6.1 獲取社交網絡數據的途徑 144
6.1.1 電子郵件 145
6.1.2 用戶注冊信息 146
6.1.3 用戶的位置數據 146
6.1.4 論壇和討論組 146
6.1.5 即時聊天工具 147
6.1.6 社交網站 147
6.2 社交網絡數據簡介 148社交網絡數據中的長尾分布 149
6.3 基於社交網絡的推薦 150
6.3.1 基於鄰域的社會化推薦算法 151
6.3.2 基於圖的社會化推薦算法 152
6.3.3 實際係統中的社會化推薦算法 153
6.3.4 社會化推薦係統和協同過濾推薦係統 155
6.3.5 信息流推薦 156
6.4 給用戶推薦好友 159
6.4.1 基於內容的匹配 161
6.4.2 基於共同興趣的好友推薦 161
6.4.3 基於社交網絡圖的好友推薦 161
6.4.4 基於用戶調查的好友推薦算法對比 164
6.5 擴展閱讀 165
第7章 推薦係統實例 166
7.1 外圍架構 166
7.2 推薦係統架構 167
7.3 推薦引擎的架構 171
7.3.1 生成用戶特徵嚮量 172
7.3.2 特徵?物品相關推薦 173
7.3.3 過濾模塊 174
7.3.4 排名模塊 174
7.4 擴展閱讀 178
第8章 評分預測問題 179
8.1 離綫實驗方法 180
8.2 評分預測算法 180
8.2.1 平均值 180
8.2.2 基於鄰域的方法 184
8.2.3 隱語義模型與矩陣分解模型 186
8.2.4 加入時間信息 192
8.2.5 模型融閤 193
8.2.6 Netflix Prize的相關實驗結果 195
後記 196
· · · · · · (
收起)
評分
☆☆☆☆☆书中低级错误遍地都是,尤其是代码 ,不看代码凑和着能看懂点东西(行文错误有的可以猜个大概),一看代码就凌乱了……上下文中用的变量名字不一致,中间有的自己的函数只有一个函数名,没有函数体,作者是想让我们猜呢?还是想让我们猜呢???尤其是68页的LFM的代码更是惨不...
評分
☆☆☆☆☆ 評分
☆☆☆☆☆书中低级错误遍地都是,尤其是代码 ,不看代码凑和着能看懂点东西(行文错误有的可以猜个大概),一看代码就凌乱了……上下文中用的变量名字不一致,中间有的自己的函数只有一个函数名,没有函数体,作者是想让我们猜呢?还是想让我们猜呢???尤其是68页的LFM的代码更是惨不...
評分
☆☆☆☆☆最近买了一本,看了几章,感觉就像在看一本加长版的研究生毕业论文,内容还算说的过去吧,介绍基本概念公式,实验对比图表很多,不免有拼凑篇幅之嫌,感觉有点不值这个价钱。 豆瓣上9.2的评分好像在书出版上市前就有了,不知道给高分的有多少是真正买了看过的,给个三星吧。
評分
☆☆☆☆☆这种贴代码的讲解方法只学到了《集体智慧编程》的一半,这里仅仅是简单的张贴出来代码,却没有给出在Python的交互式环境下运行结果,这样会让读者很疑惑,只能够整段整段的跳过代码不看了。如果还有下一版的话希望能够改进,否则很多代码里面包含了一些错误都不能够被辨别出来。