本书介绍
在处理机器学习问题时,通常有两种类型的数据(和机器学习模型)
监督数据:总是有一个或多个目标与之相关联。
无监督数据:没有任何目标变量。
有监督的问题比无监督的问题更容易解决。要求预测一个值的问题被称为监督问题。例如,如果问题是预测给定历史房价的房价,比如医院、学校或超市的存在,到最近的公共交通工具的距离等。是一个有监督的问题。类似地,当我们被提供猫和狗的图像,并且我们预先知道哪些是猫,哪些是狗,并且如果任务是创建预测所提供的图像是猫还是狗的模型,则该问题被认为是被监督的。
本书最新版pdf免费下载地址:2024最新机器学习新书-《解决几乎任何机器学习问题路径》免费pdf分享
如果目标是一个实数,这个问题被定义为一个回归问题。因此,监督问题可以分为两个子类:
分类:预测一个类别,例如狗或猫。
回归:预测一个值,例如房价。必须注意的是,有时我们可能在分类设置中使用回归,这取决于用于评估的指标。但我们稍后会谈到这一点。机器学习问题的另一种类型是无监督类型。无监督数据集没有相关的目标,一般来说,与有监督的问题相比,处理起来更具挑战性。假设你在一家处理信用卡交易的金融公司工作。每秒钟都有很多数据进来。唯一的问题是,很难找到将每笔交易标记为有效或真实交易或欺诈的人。当我们没有任何关于交易是欺诈还是真实的信息时,这个问题就变成了一个无人监管的问题。为了解决这些问题,我们必须考虑数据可以分成多少个簇。聚类是解决这类问题的方法之一,但必须注意的是,还有其他几种方法可以应用于无监督的问题。对于一个欺诈检测问题,我们可以说数据可以分为两类(欺诈或正版)。
本书目录
本书内容截图
本书免费pdf下载地址:2024最新机器学习新书-《解决几乎任何机器学习问题路径》免费pdf分享
往期精品内容推荐
ChatGPT背后原理综述-《预压模型基础综述:从BERT到ChatGPT的历史》pdf免费分享
最新中文版pdf-《ChatGPT基础原理、技术演进、场景及商业模式 白皮书》免费分享
最新GPT4解析中英文pdf《通用人工智能的火花:GPT-4的早期实验》免费分享
chatgpt 7月最新-复旦大学张奇老师《自然语言处理导论》初版pdf分享
LeetCode精选101刷题必备(C++)-附详细分类及解体说明-免费pdf分享
新书-《图神经网络表示学习技术综述》免费pdf分享
搜索推荐新书-《搜素与推荐中的深度学习匹配(Deep Match)技术》免费pdf分享
邱锡鹏DL经典教材-《神经网络与深度学习》免费pdf及ppt分享