機器學習 | 台灣Wiki

機器學習是人工智能的一個分支。人工智能的研究歷史有着一條從以“推理”爲重點，到以“知識”爲重點，再到以“學習”爲重點的自然、清晰的脈絡。顯然，機器學習是實現人工智能的一個途徑之一，即以機器學習爲手段，解決人工智能中的部分問題。機器學習在近30多年已發展爲一門多領域科際整合，涉及概率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的算法。機器學習算法是一類從數據中自動分析獲得規律，並利用規律對未知數據進行預測的算法。因爲學習算法中涉及了大量的統計學理論，機器學習與推斷統計學聯繫尤爲密切，也被稱爲統計學習理論。算法設計方面，機器學習理論關注可以實現的，行之有效的學習算法（要防止錯誤累積）。很多推論問題屬於非程序化決策，所以部分的機器學習研究是開發容易處理的近似算法。機器學習已廣泛應用於數據挖掘、計算機視覺、自然語言處理、生物特徵識別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、遊戲和機器人等領域。

定義

機器學習有下面幾種定義：

機器學習是一門人工智能的科學，該領域的主要研究對象是人工智能，特別是如何在經驗學習中改善具體算法的性能。機器學習是對能通過經驗自動改進的計算機算法的研究。機器學習是用數據或以往的經驗，以此優化計算機程序的性能標準。電腦科學家Tom M. Mitchell在其著作的Machine Learning一書中定義的機器學習為：A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

分類

機器學習可以分成下面幾種類別：

監督學習從給定的訓練數據集中學習出一個函數，當新的數據到來時，可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出，也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督學習算法包括迴歸分析和統計分類。監督學習和非監督學習的差別就是訓練集目標是否有人爲標註。他們都有訓練集且都有輸入和輸出

無監督學習與監督學習相比，訓練集沒有人爲標註的結果。常見的無監督學習算法有生成對抗網絡（GAN）、聚類。半監督學習介於監督學習與無監督學習之間。增強學習機器爲了達成目標，隨着環境的變動，而逐步調整其行爲，並評估每一個行動之後所到的回饋是正向的或負向的。

算法

具體的機器學習算法有：

構造間隔理論分佈：聚類分析和模式識別人工神經網絡決策樹感知器支援向量機集成學習AdaBoost 降維與度量學習聚類貝葉斯分類器構造條件概率：迴歸分析和統計分類高斯過程迴歸線性判別分析最近鄰居法徑向基函數核通過再生模型構造概率密度函數：最大期望算法概率圖模型：包括貝氏網路和Markov隨機場 Generative Topographic Mapping 近似推斷技術：馬爾可夫鏈蒙特卡羅方法變分法最優化：大多數以上方法，直接或者間接使用最優化算法。量子機器學習

軟件

包含各種機器學習演算法的軟體套裝包括：

免費開源軟件

Python軟件庫及框架

參考文獻

引用

來源

外部鏈接

參見 ##ACM 电脑分类系统

AdaBoost AlexNet AlphaFold AlphaGo Anthropic Apache MXNet Apache Mahout Apache Singa Apache Spark Apache SystemML Auto-GPT BERT BIRCH BLOOM (语言模型) Bagging算法 Bard Blocks CURE算法 Caffe ChatGPT Chinchilla AI DALL-E DBSCAN DNA序列 DeepDream DeepMind DeepSpeed Deeplearning4j Dlib ELKI Electrochemical RAM EleutherAI Flux (机器学习框架) F检验 GPT-1 GPT-2 GPT-3 GPT-4 GPT-J Generative Topographic Mapping Google JAX Gradio Graphcore Hugging Face Human-in-the-loop Infer.NET Isolation forest K-平均算法 K-近邻算法 Keras Kriging Kubeflow LLaMA LangChain LightGBM MIT計算機科學與人工智慧實驗室 ML.NET MOA (Massive Online Analysis) MXNet Machine learning Mallet (software project) Markov随机场 Memtransistor Meta AI Microsoft Cognitive Toolkit Midjourney Mila (研究所) Mlpack MuZero Neural Designer OPTICS Occam learning OpenAI OpenAI Five OpenNN Orange (software) PaLM Pandas (software) PyTorch Python Q学习 RETURNN ROOT SARSA算法 Scikit-learn Self-play (强化学习技术) Seq2Seq模型 Shogun (toolbox) Softmax函数 Sora (人工智能模型) SpiNNaker Stable Diffusion S型函数 T-分布随机邻域嵌入 TAIDE TensorFlow Theano Tom M. Mitchell Torch (machine learning) Torch (机器学习) Transformer模型 U-Net VC理论 Vision transformer Wald檢定 Walter Fritz WaveNet Weka (machine learning) Whisper (语音识别系统) Wolfram Mathematica Word2vec XGBoost Yooreeka Z检验一般线性模型万维网专家系统专有软件丢番图几何中位數中国学科分类国家标准/110 中心极限定理中文房间中间件主动学习 (机器学习) 主成分分析乘積極限估計量于尔根·施密德胡伯互联网档案馆交叉驗證交換代數人工智慧低谷人工智能人工智能伦理人工智能发展人工智能史人工智能哲學人工智能安全人工智能应用人工智能时间轴人工智能术语人工智能术语表人工智能热潮人工智能的存在风险人工智能监管人工智能编程语言列表人工智能项目列表人工神经网络人机交互人體圖像合成代数代数几何代数拓扑代數數論企业信息系统企业级软件伊恩·古德费洛伊爾亞·蘇茨克維众包众数 (数学) 信息与计算科学信息几何信息安全信息檢索信息系统信息论信用卡欺诈信賴區間修飾照片假說檢定偏差–方差困境偏度傅立叶分析储备池计算元分析元学习 (计算机科学) 光学字符识别入侵检测系统全距共變異數分析关联规则学习典型相关内核机器再生模型决策支持系统决策树决策树学习几何-调和平均数几何分析几何学几何平均数几何拓扑学几何数论凸分析函式庫刀切法分位圖分布式计算分布形态分類問題之損失函數切比雪夫不等式列联表列聯表初等代數医学信息学區間估計區集半参数回归模型半监督学习博弈论卡方检验印刷电路板危險比例模式卷积卷积神经网络友好的人工智能双标图反向传播算法受限玻尔兹曼机变分法变分自编码器变异系数可微函数可微分神经计算机可微分编程可穿戴计算机可视化可解釋人工智慧可计算性司徒頓t檢定吴恩达四分位数四分位距回响状态网络回声状态网络回归分析回應過程效度因素分析国际机器学习大会国际表征学习大会图像压缩图像处理图灵测试图神经网络图论圖形處理器圖模式地理信息系统均值飘移型一錯誤與型二錯誤基于人类反馈的强化学习基于规则的机器学习基于转换器的生成式预训练模型基尼系数增强学习外部设备多元處理多层感知器多智能体强化学习多模态学习多线程多重线性代数大型语言模型大衛·席爾瓦 (計算機科學家) 失效率娛樂數學学习学习曲线 (机器学习) 学徒学习实体造型实变函数论实时计算密度估计密码学对抗机器学习對數秩和檢定對立假說對話程式語言模型局部异常因子层次聚类峰度嵌入式系统希羅平均數干擾因素平均差平均数平均数不等式平方平均数并发性并发计算并行计算幹葉圖幻觉 (人工智能) 序理论应用数学度量学习廣義線性模型开源软件异常检测张量处理单元张量微积分弱人工智慧張量微積分强化学习归纳偏置归纳逻辑编程形式化方法形式语义学径向基函数核循环神经网络微分几何微分拓扑微分方程微积分微调 (深度学习) 总体感知器憶阻器手写识别扩散过程抽樣抽象代数拓扑学排序学习控制论推断统计学推理推論統計學推论描述统计学提升方法提示工程搜索引擎操作系统支持向量机支援向量機效应值教育技术学散布圖数值分析数字艺术数学数学与艺术数学主题列表数学分析数学史数学哲学数学基础数学学科分类标准数学心理学数学教育数学物理数学符号表数学纲要数学软件数学领域数据数据库管理系统数据挖掘数据清洗数据科学数据结构数理经济学数理统计学数理逻辑数论數位圖書館數位行銷數理生物學數理金融學文件管理系统文字处理器文心一言斯皮尔曼等级相关系数方差方差分析时序差分学习显著性差异普适计算普通最小二乘法曼-惠特尼檢定最优化最大似然估计最大期望算法最大间距最小距離估計最近鄰居法有限幾何學本体学习朴素贝叶斯分类器机器人机器人学机器人学习机器人控制机器学习 (期刊) 机器学习概要机器学习研究数据集列表机器学习研究期刊机械学习李飛飛条件概率条形图杨立昆杰弗里·辛顿杰米斯·哈萨比斯标准误差样本量條件隨機域梯度下降法森林圖概率分布概率密度函数概率论概率近似正确学习標準分數標準差模式识别模糊聚类機器學習控制檢定力次數 (統計學) 欧几里得几何正则化 (数学) 残差神经网络沃森 (人工智能程序) 泛代数泛函分析注意力机制测度深度学习深度学习软件比较混合智能系統混合现实渲染游戏激活函数点集拓扑学無監督學習特征工程独立成分分析生存函数生存分析生成对抗网络生成式人工智慧生成式人工智能生成模型生物信息学生物特征识别生物統計學用户界面电子商务电子游戏电子计算机百分位数皮尔逊积矩相关系数监督学习直方图直譯器相关 (概率论) 相关向量机知识知识表示矩 (數學) 矩估计示意地圖社会性软件神经信息处理系统大会神经图灵机神经形态工程神经机器翻译神经科学离散几何学离散数学离散程度科际整合秩和检验稀疏字典學習程式語言理論符號人工智能等級相關算术算术-几何平均数算术几何算术平均数算法算法分析算法效率算法设计管制圖箱形圖簡單線性迴歸类型论系统平台系统架构統計誤用網絡戰線上機器學習線性判別分析線性回歸線性模型編譯器约书亚·本希奥线性代数线性判别分析线性整流函数组合数学经验风险最小化结构预测统计分类统计图形统计学统计学习理论统计学出版物统计流形统计类型绿色计算编程范型编程语言缺失数据网络传输协议网络安全网络拓扑网络服务群论聊天機器人聚类聚类分析肯德等級相關係數脉冲神经网络臉部辨識系統自主控制机器人自动推理自动机自动机器学习自动规划和调度自助法自動微分自動駕駛汽車自我迴歸模型自然语言处理自由度 (统计学) 自监督学习自组织映射自编码器艾力克斯·格雷夫斯 (計算機科學家) 范畴论蒙特卡罗方法虚拟现实虛擬機器虛無假說行动选择表征学习複分析规律视觉处理单元解析几何解析数论計算機代數系統計算社會科學計算複雜性理論認知計算語意分析語言模型調和分析證券市場计算几何计算化学计算复杂性理论计算学习理论计算数学计算智能计算机动画计算机图形学计算机安全计算机硬件计算机科学计算机科学重要出版物计算机系统结构计算机网络计算机视觉计算机辅助功能计算机逻辑计算物理学计算理论计算生物学计算语言学计量经济学认知科学训练集、验证集和测试集诊断试验设计语法归纳语音合成语音识别误差调和平均数谷歌大脑貝氏網路贝叶斯回归贝叶斯学习贝叶斯推断超大规模集成电路趋势图路由軟體套裝軟體框架軟體維護软件开发软件开发工具软件开发过程软件设计软件质量软件部署软件配置管理辩手项目迁移学习过程控制运算学习理论运算数学运算科学进化算法进化计算迴歸分析适当广义分解通用人工智慧逼近论運算學習論運籌學過適遗传算法邏輯斯諦迴歸重抽样重複 (統計學) 量子機器學習量子计算机長短期記憶门控循环单元间隔理论阻碍降维随机化算法随机梯度下降随机森林隐马尔可夫模型隨機抽樣一致集中趋势集合论集成学习集成开发环境集成电路雷达图電子出版電子設計自動化電腦數據存貯器需求分析靈敏度和特異度非参数回归模型非欧几里得几何非監督式學習非程序化決策非线性回归非负矩阵分解领域特定语言饼图马尔可夫链

定義#

分類#

算法#

軟件#

免費開源軟件#

Python軟件庫及框架#

參考文獻#

引用#

來源#

外部鏈接#

參見 ##ACM 电脑分类系统#

定義

分類

算法

軟件

免費開源軟件

Python軟件庫及框架

參考文獻

引用

來源

外部鏈接

參見 ##ACM 电脑分类系统