LOADING...
LOADING...
LOADING...
当前位置: 玩币族首页 > 新闻观点 > 半监督机器学习算法

半监督机器学习算法

2020-01-15 Askljan 来源:区块链网络

人工智能是一个系统,它不仅可以解决指定的任务,还可以学习如何解决新问题,包括创造性的问题。以前,这一过程只适用于人类大脑,但现在人工创建的程序也可以做到这一点。人工智能系统需要学习算法来研究和创建相应的模式,以改进程序,并在未来提供更好的结果。

机器学习算法可以分为控制(它包含了朴素贝叶斯分类、决策树、最小二乘法、逻辑回归、支持向量方法,整体方法),控制(聚类算法、主成分法、奇异分解,分析独立的组件),和半监督学习(混合型),在线学习,强化学习,转换式学习、元学习,主动学习。

受控方法假设先前使用的数组对于正在进行的任务也是有用的。如果当前的任务没有更早地执行,机器就有可能学习如何使用学习算法来完成它,这样在以前使用的受控方法中,数组也可以对正在进行的任务有用。这些方法被用于人脸识别系统、垃圾邮件筛选、计算自然灾害的概率、预测广告的成功与否等。如果数据集没有标记,则应用非受控方法,并且需要使用非受控方法来查找其中的隐式关系。使用非受控系统的例子包括:

观察生物学中大量基因的相互作用;

在社会学研究中,语言和图像识别;

复杂计算系统和机制的诊断。

半监督机器学习算法是监督系统和非监督系统的混合。受控算法使用开发人员输入的数据和所有变量,所有这些元素一起提供了给定问题的解决方案。如果开发人员不能指定所有准确的数据,或者只能指定部分数据,那么这种学习算法方法非常适合在这种情况下解决问题。

当开发人员输入数据并标记它时,这个过程就开始了。然后,该程序将能够根据系统中确定的模式预测未标记数据的解决方案。它将使用程序以前解决这类任务的经验来处理。

如果在大量未标记的数据中,至少放置少量已标记的数据,则可以获得较高的ML溶液的准确性。然后,机器将能够根据给定的数据得出合乎逻辑的结论。然而,需要一个观察者来控制这个过程并为将来的使用解密数据。

如果你想深入研究ML算法的主题,你应该注意以下理论,这些理论可以更好地理解所有的AI系统是如何工作的:

连续性假设(存在非常接近且有很高概率的点将具有相同的输出标签)

集群假设(如果要将所有数据划分为不同的集群,则此类组的所有数据很可能具有相同的输出标签)

流形假设(输入空间的大小远远大于数据所在的区域)

半监督算法被应用于从金融科技到娱乐应用的各种行业。在银行业,ML系统扮演着重要的角色,因为它们帮助组织构建数据安全性。有一个样本的人目前是银行的客户。开发人员必须创建一个使管理部门更容易发现欺诈的程序。开发人员只知道很少的网络犯罪案例,他把所有的案例都输入数据库。

他不知道其余的情况,他的任务是发现所有的情况,以防止将来的欺诈。由于开发人员没有标记需要标识的数据,因此应该由计算机找到这些数据以继续工作。观察者标记程序的已知数据,并使系统能够使用这些信息进行学习。在这种情况下,系统将在开发人员引入的现有模式和算法的基础上进行培训,但也将检测没有准确结果的数据集并使用它们。

在这种情况下,半监督算法效果最好,因为它们结合了受控和非受控系统的特点。需要人工干预来翻译或解密收集的数据,进行需要第三方对象或位置和物理存在的实验。

然而,大数据系统需要一种不同的方法。对开发人员来说,手工标记模式可能很有挑战性,因此他需要一个自动化的系统来代替人工工作。在这种情况下,需要经过专门训练的专业人员来处理数据库。虽然基于人的方法在这种情况下是合理的,但它可能会消耗资源和效率低下。

近年来,苏密监控系统在教育领域得到了广泛的应用。例如,当老师在学校布置任务并与学生一起解决时,学生输入特定的数据来找到正确的解决方案。

这种方法类似于在程序中使用标记数据的方法。然后老师布置家庭作业,学生学习使用熟悉的算法自己解决任务。

但是,只有一部分任务具有相同的结构和解决算法。因此,在老师的监督下,学生们逐渐学会解决所有新的问题,这些问题最初并不是在教室里分解的。这种教育方法非常有效。因此,它已成功地应用于人工智能和毫升系统。

要确定哪种机器学习算法最适合您的项目或产品,您必须评估任务的紧迫性,考虑必要的解决方案,估计处理挑战所需的时间和资源,并确定输入数据的数量、大小和类型。这种深入的评估将使您了解需要哪种算法,并引导您找到最优的解决方案。

—-

编译者/作者:Askljan

玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。

LOADING...
LOADING...