Python機器學習算法pdf

圖書網
圖書網
圖書網
10136
文章
1357
評論
2020年4月28日22:09:00 評論 5

Python機器學習算法 作者:趙志勇

Python機器學習算法 出版社:電子工業出版社

Python機器學習算法 內容簡介

《Python機器學習算法》是一本機器學習入門讀物,注重理論與實踐的結合。全書主要包括6個部分,每個部分均以典型的機器學習算法為例,從算法原理出發,由淺入深,詳細介紹算法的理論,并配合目前流行的Python語言,從零開始,實現每一個算法,以加強對機器學習算法理論的理解、增強實際的算法實踐能力,最終達到熟練掌握每一個算法的目的。與其他機器學習類圖書相比,《Python機器學習算法》同時包含算法理論的介紹和算法的實踐,以理論支撐實踐,同時,又將復雜、枯燥的理論用簡單易懂的形式表達出來,促進對理論的理解。

Python機器學習算法 目錄

前言

0 緒論

0.1 機器學習基礎

0.2 監督學習

0.3 無監督學習

0.4 推薦系統和深度學習

0.5 Python和機器學習算法實踐

參考文獻

第一部分 分類算法

1 Logistic Regression

1.1 Logistic Regression模型

1.2 梯度下降法

1.3 梯度下降法的若干問題

1.4 Logistic Regression算法實踐

參考文獻

2 Softmax Regression

2.1 多分類問題

2.2 Softmax Regression算法模型

2.3 Softmax Regression算法的求解

2.4 Softmax Regression與Logistic Regression的關系

2.5 Softmax Regression算法實踐

參考文獻

3 Factorization Machine

3.1 Logistic Regression算法的不足

3.2 因子分解機FM的模型

3.3 FM算法中交叉項的處理

3.4 FM算法的求解

3.5 因子分解機FM算法實踐

參考文獻

4 支持向量機

4.1 二分類問題

4.2 函數間隔和幾何間隔

4.3 支持向量機

4.4 支持向量機的訓練

4.5 支持向量機SVM算法實踐

參考文獻

5 隨機森林

5.1 決策樹分類器

5.2 CART分類樹算法

5.3 集成學習(Ensemble Learning)

5.4 隨機森林(Random Forests)

5.5 隨機森林RF算法實踐

參考文獻

6 BP神經網絡

6.1 神經元概述

6.2 神經網絡模型

6.3 神經網絡中參數的求解

6.4 BP神經網絡中參數的設置

6.5 BP神經網絡算法實踐

參考文獻

第二部分 回歸算法

7 線性回歸

7.1 基本線性回歸

7.2 線性回歸的最小二乘解法

7.3 牛頓法

7.4 利用線性回歸進行預測

7.5 局部加權線性回歸

參考文獻

8 嶺回歸和Lasso回歸

8.1 線性回歸存在的問題

8.2 嶺回歸模型

8.3 Lasso回歸模型

8.4 擬牛頓法

8.5 L-BFGS求解嶺回歸模型

8.6 嶺回歸對數據的預測

參考文獻

9 CART樹回歸

9.1 復雜的回歸問題

9.2 CART回歸樹生成

9.3 CART回歸樹剪枝

9.4 CART回歸樹對數據預測

參考文獻

第三部分 聚類算法

10 K-Means

10.1 相似性的度量

10.2 K-Means算法原理

10.3 K-Means算法實踐

10.4 K-Means++算法

參考文獻

11 Mean Shift

11.1 Mean Shift向量

11.2 核函數

11.3 Mean Shift算法原理

11.4 Mean Shift算法的解釋

11.5 Mean Shift算法實踐

參考文獻

12 DBSCAN

12.1 基于密度的聚類

12.2 DBSCAN算法原理

12.3 DBSCAN算法實踐

參考文獻

13 Label Propagation

13.1 社區劃分

13.2 Label Propagation算法原理

13.3 Label Propagation算法過程

13.4 Label Propagation算法實踐

參考文獻

第四部分 推薦算法

14 協同過濾算法

14.1 推薦系統的概述

14.2 基于協同過濾的推薦

14.3 相似度的度量方法

14.4 基于協同過濾的推薦算法

14.5 利用協同過濾算法進行推薦

參考文獻

15 基于矩陣分解的推薦算法

15.1 矩陣分解

15.2 基于矩陣分解的推薦算法

15.3 利用矩陣分解進行推薦

15.4 非負矩陣分解

15.5 利用非負矩陣分解進行推薦

參考文獻

16 基于圖的推薦算法

16.1 二部圖與推薦算法

16.2 PageRank算法

16.3 PersonalRank算法

16.4 利用PersonalRank算法進行推薦

參考文獻

第五部分 深度學習

17 AutoEncoder

17.1 多層神經網絡

17.2 AutoEncoder模型

17.3 降噪自編碼器Denoising AutoEncoder

17.4 利用Denoising AutoEncoders構建深度網絡

17.5 利用TensorFlow實現Stacked Denoising AutoEncoders

參考文獻

18 卷積神經網絡

18.1 傳統神經網絡模型存在的問題

18.2 卷積神經網絡

18.3 卷積神經網絡的求解

18.4 利用TensorFlow實現CNN

參考文獻

第六部分 項目實踐

19 微博精準推薦

19.1 精準推薦

19.2 基于用戶行為的挖掘

19.3 基于相似用戶的挖掘

19.4 點擊率預估

19.5 各種數據技術的效果

參考文獻

附錄A

附錄B

Python機器學習算法 精彩文摘

分類算法是典型的監督學習,其訓練樣本中包含樣本的特征和標簽信息。在二分類中,標簽為離散值,如{+1,-1},分別表示正類和負類。分類算法通過對訓練樣本的學習,得到從樣本特征到樣本的標簽之間的映射關系,也被稱為假設函數,之后可利用該假設函數對新數據進行分類。

Logistic Regression算法是一種被廣泛使用的分類算法,通過訓練數據中的正負樣本,學習樣本特征到樣本標簽之間的假設函數,Logistic Regression算法是典型的線性分類器,由于算法的復雜度低、容易實現等特點,在工業界得到了廣泛的應用,如:利用Logistic Regression算法實現廣告的點擊率預估。

1.1 Logistic Regression模型

1.1.1 線性可分VS線性不可分

對于一個分類問題,通??梢苑譃榫€性可分與線性不可分兩種。如果一個分類問題可以使用線性判別函數正確分類,則稱該問題為線性可分,如圖1.1所示;否則為線性不可分問題,如圖1.2所示。

圖1.1 線性可分

圖1.2 線性不可分

1.1.2 Logistic Regression模型

Logistic Regression 模型是廣義線性模型的一種,屬于線性的分類模型。對于圖1.1 所示的線性可分的問題,需要找到一條直線,能夠將兩個不同的類區分開,如圖1.1所示,這條直線也稱為超平面。

對于上述的超平面,可以使用如下的線性函數表示:

其中W 為權重,b為偏置。若在多維的情況下,權重W 和偏置b均為向量。在Logistic Regression算法中,通過對訓練樣本的學習,最終得到該超平面,將數據分成正負兩個類別。此時,可以使用閾值函數,將樣本映射到不同的類別中,常見的閾值函數有Sigmoid函數,其形式如下所示:

Sigmoid函數的圖像如圖1.3所示。

圖1.3 Sigmoid函數

從Sigmoid函數的圖像可以看出,其函數的值域為(0,1),在0附近的變化比較明顯。其導函數 f′(x)為:

現在,讓我們利用Python實現Sigmoid函數,為了能夠使用numpy中的函數,我們首先需要導入numpy:

import numpy as np

Sigmoid函數的具體實現過程如程序清單1-1所示。

程序清單1-1 S igmoid函數

在程序清單1-1中,Sigmoid函數的輸出為Simoid值。對于輸入向量X,其屬于正例的概率為:

其中,σ表示的是Sigmoid函數。那么,對于輸入向量X,其屬于負例的概率為:

對于Logistic Regression算法來說,需要求解的分隔超平面中的參數,即為權重矩陣W 和偏置向量b,那么,這些參數該如何求解呢?為了求解模型的兩個參數,首先必須定義損失函數。

圖書網:Python機器學習算法pdf

恭喜,此資源為免費資源,請先
聲明:本站所有資源收集于互聯網,只做學習和交流使用,版權歸著作人和出版社所有,請在下載后24小時之內自覺刪除,若作商業用途,請購買正版,由于未及時購買和付費發生的侵權行為,與本站無關。本站發布的內容若侵犯到您的權益,請聯系站長刪除,我們將及時處理!
繼續閱讀
  • 我的微信
  • 掃一掃加好友
  • weinxin
  • 微信公眾號
  • 掃一掃關注
  • weinxin
程序員修煉之道 程序設計入門30講epub 程序設計

程序員修煉之道 程序設計入門30講epub

目標性強:針對編程初學者,幫助初學者跨越編程的道門檻。 問題典型,回答生動:采用一問一答的編寫形式,解決編程時容易遇到的典型問題。 章節獨立:可以任意選擇感興趣的章節進行閱讀。
HBase不睡覺書epub 程序設計

HBase不睡覺書epub

本書適合HBase的初學者,欲深入了解HBase配置、部署、優化和二次開發的軟件工程師,以及任何對云計算或者NoSQL相關技術感興趣的讀者。
C語言實用之道pdf 程序設計

C語言實用之道pdf

C語言實用之道 作者:(美)朱里奧·贊博(Giulio Zambon) C語言實用之道 出版社:清華大學出版社 C語言實用之道 內容簡介 閱讀《C語言實用之道》,可以學習實用的C技術,包括在可復用的函...
C#項目開發全程實錄 第4版epub 程序設計

C#項目開發全程實錄 第4版epub

C#項目開發全程實錄 第4版 作者:明日科技 C#項目開發全程實錄 第4版 出版社:清華大學出版社 C#項目開發全程實錄 第4版 內容簡介 《C#項目開發全程實錄(第4版)》以房屋中介管理系統、企業客...
匿名

發表評論

匿名網友 填寫信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: