領券無上限 五購給力 贊助
2021-09-06 05:58:02PChome書店

機器學習(Lasso推論模型)使用Stata、Python分析


機器學習(Lasso推論模型)使用Stata、Python分析
作者:張紹勳 出版社:五南 出版日期:2021-08-10 00:00:00

<內容簡介>

你絕對不能錯過的機器學習工具書!
※揭開機器學習的神祕面紗,深入了解機器學習。
※理論與實務兼具,詳細解說機器學習理論,搭配使用Python與Stata實作,架構完整。
※內容與時俱進,理解當今機器學習的最新模型與技術。
※隨書附贈範例資料檔光碟

近年來,科技產業迅速發展,新技術不斷出現,人工智慧、機器學習、大數據、資料科學成為炙手可熱的話題。各個領域紛紛投入人工智慧與機器學習的研究及應用,但究竟什麼是人工智慧?機器學習又是什麼?

機器學習是人工智慧應用最成熟的領域。本書首先解說機器學習與人工智慧、統計學的關係,給予讀者完整的知識輪廓,接著深入探討機器學習的理論模型,例如:Lasso迴歸、梯度下降法、深度學習、隨機森林,同時輔以Python與Stata實作範例。本書兼具理論與實際操作,是給想深入研究機器學習與人工智慧的你,最適合的一本工具書。

★目錄:

Chapter 1 AI?機器學習(ML)的關係
1-1 著名的AI系統、頂尖AI公司、最佳AI軟體
1-2 人工智慧(AI)之發展
1-3 機器學習(machine learning, ML)概論

Chapter 2 機器學習(ML)與統計關係
2-1 統計、估計
2-2 機器學習(ML)之原理(principles)
2-3 機器學習(ML)之重點整理
2-4 類神經網路(ANN):單一隱藏層
2-5 深度學習(deep learning):多個隱藏層
2-6 深度學習結構,有4 種:DNN、DBN、CNN、CDBN
2-7 深度學習法(非線性模型):兩個隱藏層的多層感知器(外掛指令mlp2)

Chapter3 機器學習式迴歸之重點整理(經濟學)
3-1 統計vs. 機器學習之懲罰項迴歸(感測器來收集大數據)
3-2 特徵選擇(feature selection)(從眾多預測變數組合中,挑有意義Xs)
3-3 收縮估計法(shrinkage estimation):自變數(特徵)選擇採用嵌入法
3-4 交叉驗證:避免一次性訓練及測試資料所產生偏誤(Stata 外掛指令loocv 指令)
3-5 降維(降低維度,dimension reduction)
3-6 非線性模型(nonlinear models):神經網路
3-7 集成學習(ensemble learning):決策樹、迴歸樹至隨機森林
3-8 大數據(big data)

Chapter 4 Lasso 迴歸、平方根lasso 迴歸、elastic net迴歸、Lasso 推論模型:(收縮法shrinkage)
4-1 Ridge 迴歸(L2-norm)、Lasso(L1-norm)、elastic net 迴歸是什麼?
4-2 三種Lasso 迴歸式,挑選最佳λ之收縮率(lasso linear 等指令)
4-3 elastic net 迴歸?Ridge 迴歸(elasticnet linear等指令)
4-4 ridge、Lasso、elastic net 迴歸的比較(外掛指令lassoregress、ridgeregress、elasticregress)
4-5 Lasso 推論模型:連續依變數
4-6 Lasso 推論模型:二元依變數

Chapter 5 梯度下降法、深度學習分析
5-1 梯度下降法(gradient descent)
5-2 Python 實作:梯度下降演算法(gradient descent algorithm)

Chapter 6 集成(ensemble) 學習:隨機森林迴歸(外掛指令randomforest)
6-1 決策樹(decision tree):森林的元素
6-2 隨機森林的原理
6-3 隨機森林之迴歸分析:連續依變數(外掛指令randomforest)
6-4 隨機森林之迴歸分析:二元依變數外掛指令(randomforest)

Chapter7 支援向量機(SVM) 之分析(外掛指令:svmachines)
7-1 機器學習法:支援向量機(SVM) 的原理
7-2 支援向量機之迴歸分析:連續依變數(外掛指令svmachines)
7-3 支援向量機之迴歸分析:類別依變數(外掛指令svmachines)

<作者簡介>

張紹勳
學歷:國立政治大學資訊管理博士
現職:國立彰化師大專任教授
經歷:致理技術專任副教授

研究助理

張任坊
學歷:國立海洋大學商船系
現職:長榮海運三副

張博一
學歷:國立中央大學通訊工程所
現職:泰洛科技股份有限公司工程師

★內文試閱:

Chapter 1 AI?機器學習(ML)的關係

本書旨在揭開機器學習(machine learning, ML) 神祕面紗。機器學習是人工智慧應用最成熟的領域。迄今人工智慧(artificial intelligence, AI) 在各學門的研究成效,有目共睹。例如:武漢肺炎疫情嚴峻,成功大學利用AI 來分類高風險病人臨床檢疫效率,從原需150 分鐘縮短到不到30 分鐘,接著國衛院發明快篩只要15 分。其實,2020 年1 月9 日世界衛生組織警告中國有類似流感的疫病在中國武漢爆發,美國疾病管制及預防中心於1 月6 日提早接獲通知,但是一家加拿大健康監控平臺卻早在2019 年12 月31 日,成功使用AI 預測有肺炎疫情爆發。

一、人工智慧是什麼?

人工智慧定義可分兩部分,即「人工」及「智慧」;「人工」就是人造的,此定義爭議不大,但仍須考慮什麼是人力所能及製造的?或者人的智慧程度有沒有高到可以創造人工智慧的地步等。總括來說,「人工」就是通常意義下的人工系統。

什麼是「智慧」,問題比較大,它涉及到:意識(consciousness)、自我(self)、心靈(mind) 及無意識的精神(unconscious mind) 等問題。我們了解的智慧係指人本身的智慧,這是普遍認同的觀點。但是人們對自身智慧的理解都非常有限,對構成人的智慧必要元素的了解更有限,故很難定義什麼是「人工」製造的「智慧」了。因此AI 研究往往涉及對人智慧本身的研究,「意識」是人對環境及自我的認知慧力及認知的清晰程度。例如:某人覺察到了什麼、某人覺察到了自我。有時候,「覺察」與「意識」是同義詞,二者甚至可以相互替換。目前在意識本質的問題上還存有諸多疑問,例如:在自我意識方面。意識這個問題涉及到認知科學、神經科學、心理學、電腦科學、社會學、哲學等。

希爾勒曾用意識及身體思考來批評「強AI」,認為感知是生物整個物理特性,意識是有目的性的,但AI 電腦沒有目的性,因此電腦沒有意識。

AI 主要功效包括:知識推理、規劃、機器學習的統計、自然語言處理、電腦視覺、機器人等。簡單來說,機器人像是人的「身軀」,AI 則是人的「腦」,物聯網(IoT) 人體的五種感官(臉上的眼、耳、口、鼻,各掌控一種感官,再加上觸覺)。

今日的AI 又稱狹窄的AI(或弱AI),因為它被設計為執行狹窄的任務(例如:功能僅限財金預測、人臉辨識、Internet 搜尋、僅自駕汽車、醫學診斷等)。然而,許多研究者的長期目標是建立一般化AI(AGI 或強AI)。雖然狹窄的AI在任何特定任務中都可能勝過人類(例如:下棋或解決方程式),但AGI 在幾乎每一項認知任務中都會勝過人類。

AI 技術應用,從Apple 手機的語音助理Siri 到自動駕駛汽車等,這些AI 議題正在迅速發展。雖然科幻小說通常將AI 描述為具有類似人類特徵的機器人,但AI 可以包含從Google 的搜尋演算法(alogorithm)、IBM's Watson 到自動武器的任何東西。

例如:醫療的AI 應用,就有四個重要的議題:機器學習(ML)、自然語言處理(NLP)、電腦視覺及智慧機器人(例如:達文西手術機器人)。由此可見,機器學習是AI 應用之一,它使系統能夠自動學習並從經驗中進行改進,而無需進行明確的編程(programming)。ML 專注於計算機程序的開發,該程序可以訪問數據並用它來自我學習。