当前位置：首页 > news >正文

燕窝网站怎么做的自己怎么搭建网站

news 2025/7/15 13:27:24

燕窝网站怎么做的,自己怎么搭建网站,安平做网站的电话,网站前台空白学习视频：第1章-绪论_哔哩哔哩_bilibili 西瓜书对应章节： 第一章 & 第二章文章目录机器学习三观What：什么是机器学习？Why: 为什么要学机器学习？1. 机器学习理论研究2. 机器学习系统开发3. 机器学习算法迁移 &…

学习视频：第1章-绪论_哔哩哔哩_bilibili
西瓜书对应章节：第一章 & 第二章

文章目录

机器学习三观
- What：什么是机器学习？
- Why: 为什么要学机器学习？
- - - 1. 机器学习理论研究
    - 2. 机器学习系统开发
    - 3. 机器学习算法迁移（AI+）
    - 4. AI 应用方向研究：NLP, CV, 推荐系统
- How: 怎样学习深度学习？
- - - - 纯理论研究
    - - 系统的开发
    - - 算法迁移（AI for Science)
    - - AI 应用方向研究
基础核心知识概念
- - - 假设空间 & 版本空间
    - 算法
    - 样本（示例）
    - 标记
    - 样本空间 & 标记空间
    - 机器学习任务分类（根据标记取值类型不同）
    - 机器学习任务分类（根据是否用到标记信息）
    - 数据集
    - 泛化
    - 分布
    - 归纳偏好
数据决定模型的上限，算法则是让模型无限逼近上限
- - - - 数据决定模型的上限
模型评估与选择
- - 经验误差与过拟合
- - - - 精度
    - - 训练误差 & 泛化误差
    - - 过拟合
    - - 欠拟合
- - 评估方法
- - - - 留出法
    - - 交叉验证法
    - - 自助法
    - - 验证集
- 性能度量
- - - - 均方误差
    - - 错误率
    - - 精度
    - - 查准率 & 查全率
    - - F1 度量
    - - ROC 曲线
    - - 代价敏感错误率 & 代价曲线
    - - 比较检验
    - - - 假设检验
    - - 交叉验证T检验
    - - McNemar 检验
    - - Friedman 检验和 Nemenyi 后续检验
    - - 偏差与方差

机器学习三观

What：什么是机器学习？

关键词：“学习算法”

Why: 为什么要学机器学习？

1. 机器学习理论研究

2. 机器学习系统开发

3. 机器学习算法迁移（AI+）

4. AI 应用方向研究：NLP, CV, 推荐系统

How: 怎样学习深度学习？

- 纯理论研究

- 系统的开发

1C6PR5L3A4ALU899PL%6V.png

- 算法迁移（AI for Science)

- AI 应用方向研究

基础核心知识概念

假设空间 & 版本空间

假设空间定义了所有可能的解决方案；版本空间则是在考虑了训练数据后，认为可能正确的解决方案的集合

算法

从数据中学得模型的“具体方法”，其产出结果称为“模型”

样本（示例）

关于一个事件或对象的描述。用向量进行表示，向量中的各个维度称为“特征”或“属性“。向量中的元素用分号 “;” 表示为列向量，用逗号 ","表示为行向量。

标记

学习样本在某方面的表现存在潜在规律的的信息。

样本空间 & 标记空间

所有可能的输入数据或特征向量的集合；
所有可能的输出标签或目标值的集合

机器学习任务分类（根据标记取值类型不同）

标记取值为“离散型”，任务为分类
标记取值为 “连续型”，任务为回归

机器学习任务分类（根据是否用到标记信息）

训练阶段有用到标记信息，此类任务为 “监督学习”
训练阶段没用到标记信息，此类任务为 “无监督学习”

数据集

通常用集合表示
一般同一份数据集中的每个样本都含相同个数的特征
样本 $x_{ij}$ 表示样本 $x_i$ 在第 j 个属性上的取值

泛化

模型对未在训练过程中见过的数据进行准确预测的能力

分布

概率论中的概率分布。

归纳偏好

不同的机器学习算法有不同的偏好

最常用的评价方法是 - 基于模型在测试集上的表现评判模型的优劣。
机器学习算法没有绝对的优劣之分，只有是否适合当前待解决问题之分。
没有免费的午餐定理（NFL)：众算法生而平等（哪个算法训出来的模型在测试集上表现好哪个算法 nb）。

数据决定模型的上限，算法则是让模型无限逼近上限

- 数据决定模型的上限

数据是指从 数据量 和 特征工程 两个角度考虑

通常数据量越大模型效果越好
通常对特征数值化越合理，特征收集越全越细致，模型效果通常越好

模型评估与选择

- 经验误差与过拟合

- 精度

- 训练误差 & 泛化误差

训练集上的误差；新样本上的误差

- 过拟合

- 欠拟合

- 评估方法

- 留出法

直接将数据集划分为 数据集 和 测试集 。

训练集和测试集要尽量保证数据分布的一致性
采用采样类别比例相似的 分层采样 。

- 交叉验证法

先将数据集划分为 k 个互斥子集，尽可能保持数据分布的一致性，然后以 k-1 个子集的并集作为训练集，余下子集作为测试集，进行k次训练测试，最终返回训练结果的均值。

有m个数据，令 k = m，则为 留一法 。

- 自助法

可重复有放回采样。

训练集的数量会增多
有可能会改变数据集的分布

- 验证集

对模型进行评估测试的数据集。

性能度量

- 均方误差

- 错误率

分类错误样本数占样本总数的比例。

- 精度

分类正确的样本数占样本总数的比例。

- 查准率 & 查全率

- F1 度量

- ROC 曲线

- 代价敏感错误率 & 代价曲线

X轴 -

Y轴 -

- 比较检验

- 假设检验

- 交叉验证T检验

- McNemar 检验

- Friedman 检验和 Nemenyi 后续检验

- 偏差与方差

偏差度量了学习算法的期望预测与真实结果的偏离程度，刻画了学习算法本身的拟合能力
方差度量了同样大小的训练集的变动导致的学习性能的变化，刻画了数据扰动造成的影响
噪声表达了当前任务上任何学习算法所能达到的期望泛化的误差的下界，刻画了学习问题本身的难度
泛化性能是由学习算法的能力、数据的充分性、学习任务本身的难度共同决定的。为了取得良好的泛化性能，需要使得方差、偏差都较小。

http://www.15wanjia.com/news/34474.html

相关文章：

外国做的福利小视频在线观看网站有没有专门做营销的公司

设计工作室网站源码厦门seo公司到1火星

茶叶怎么做网站销售做网络营销推广的公司

免费网站建设合同范本网络推广外包流程

新人做网站盈利常州百度推广代理公司

企业网站的cms哪个网站是免费的

上海网站建设的企带佣金的旅游推广平台有哪些

b2c网站推广班级优化大师app

沧州网站制作报价最新实时新闻

传智播客网站开发全套视频教程郑州网站建设公司排名

高邑做网站宁波seo关键词

网站打不开404营销策划与运营团队

网站建设开发公司地址推广软件赚钱

专业做高端网站seo关键词首页排名代发

国外什么推广网站好58同城如何发广告

眼科医院网站设计怎么做百度app免费下载安装

小公司如何做网站打开百度一下

网站图片自动轮换怎么做的关键词优化公司排名

日本做瞹瞹嗳视频网站长尾关键词

天蝎网站建设优化大师最新版下载

WordPress电脑与手机网络优化工程师是干什么的

用wordpress做购物网站发布广告的平台免费

b2b的两种网站类型seo推广是做什么

做网站可以用中文域名备案嘛无锡seo优化

网站建设推广优化排名品牌推广活动策划方案

学做蛋糕网站a站

外贸网站如何做seo网络营销课程感悟

台州卫浴网站建设网络营销成功的案例及其原因

做gif动图的网站犯法吗线上营销有哪些

乐清微网站建设seo营销方法