1102 機器學習

這篇文章是學習時整理的一些筆記,讓自己複習時方便,文章部分內容為上課之內容及閱讀清單之整理

Introduction

Learning is to find a function
機器學習最終的目的就是要找到那個函式,讓我們把x丟入函式後可以得到理想中的y

而我們要怎麼找到那個函式,就是要去學習
我們可以使用大量的資料和演算法來訓練機器,讓他學習如何執行任務
有很多學習的方法可以幫助我們找到那個函式

Every machine learning algorithm has three components:
– Representation
– Evaluation
– Optimization

Representation

Representation指的是架構、模型
例如:Decision tree, graphical model, neural network, SVM…等等

Evaluation

Evaluation指的是衡量這個架構好壞的方法
例如:Accuracy, precision, recall, entropy…等等

Optimization

在訓練過程中的最佳化方法

  1. Combinatorial optimization
    – E.g.: Greedy search
  2. Convex optimization
    – E.g.: Gradient descent
  3. Constrained optimization
    – E.g.: Linear programming

Learning Way

在開始之前,可以先了解一下機器學習的方法有哪些~

文章: 機器學習的四種方式 - 監督、非監督、半監督、強化式
連結:https://essen900718.github.io/2022/04/06/ml/learningway/

Algorithm

總結來說,機器學習的演算法大致可以分為以下幾類:

種類 解決問題類型 欲求
迴歸算法 是多少 期望得出一個數值
分類算法 是什麼 期望得出一個分類 是狗?是貓?
聚類算法 怎麼分 期望特徵相似樣本在一群 得知怎麼分類資料
強化學習 怎麼做 期望得知當前狀態該如何動作可以得到最大回報

我們可以依據我們想解決的問題去挑選我們要用什麼方法

Regression

文章: Regression 文章筆記整理
連結:https://essen900718.github.io/2022/04/06/ml/linear/

Classification

文章: Classification 文章筆記整理 - ft. Decision Tree, Random Forest, SVM
連結:https://essen900718.github.io/2022/04/08/ml/classification/

Clustering

文章: Clustering 文章筆記整理 - ft. k-means, k-medioids, hierarchical clustering, density based clustering(DBSCAN)
連結:https://essen900718.github.io/2022/04/09/ml/clustering/

Reinforcement learning

(哎呀暫時沒有這篇文章哈哈)

Reference

  1. 机器学习发展历史回顾