有关计算机视觉进步的新报告重点介绍了一些抽象概念,以及有关我们如何训练计算机以“看得见”的更深层次的问题。 今天,The Verge的报告讨论了作家詹姆斯·文森特(James Vincent)所说的“躺在床上的锤子”问题,其中显示了ObjectNet数据训练中心化的示例,以说明在对象识别方面愚弄计算机很容易。 在某些情况下-过去几年来,工程师在成交量积神经网络方面取得了飞速进步-成交量积神经网络具有多个处理层,采用特殊的算法方法来扫描图像。 过去取得的一些显著成就包括功能丰富的图像-例如,计算机学会了向我们展示奇瓦瓦州和蓝莓松饼的照片,它们都含有深色球根球,无论它们是眼睛还是浆果。 文森特(Vincent)关于麻省理工学院(MIT)科学家AI视觉工作的报告向我们展示的是,即使基于最先进的算法,计算机所能直观看到的内容也有一定的限制。 正如文森特(Vincent)所指出的,本报告中处理的椅子和其他物品不会出现在训练数据中。 文森特写道:“这些系统对现实世界中的物体如何工作的了解有限。” “人工智能系统无法轻松地从他们以前看过的项目中推断出来,以想象它们在不同的照明条件下如何从不同的角度出现。” 你可能还注意到,被称为困难对象的种类并不是功能丰富的,而是基于常见的几何形状。 考虑到这一点,计算机算法很难识别像锤子一样的东西可能就不足为奇了。 实际上,尽管文森特(Vincent)建议人类可以轻松识别图像,但我们都知道有多少东西看起来像其他东西,特别是在弱光或混乱的彩色并列的情况下。 同时,Indata Labs的Valerie Shchutskaya建议,深度学习网络正在为计算机系统如何跟踪对象(包括视频)在KDNuggets上进行跟踪的未来重大进展铺平道路: 另一方面,深度学习算法通过神经元网络了解当前任务,这些神经元将任务映射为概念层次。每个复杂的概念由一系列更简单的概念定义。所有这些算法都可以自己完成。在计算机视觉的背景下,这意味着先识别明暗区域,然后对线条进行分类,然后再进行形状识别,然后再进行全面的图像识别。 当你向深度学习算法提供更多数据时,它们的性能也会更好,这不是机器学习算法所特有的。 请继续关注有关VR / AR,图像处理和计算机视觉的更多信息,以及这些是由于行业变化而引起的。 —- 编译者/作者:不详 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
低画质影像给计算机视觉带来挑战
2019-12-13 不详 来源:区块链网络
LOADING...
相关阅读:
- 社区征文丨当BHP遇上Cosmos,会迸发怎样的火花?2020-08-05
- 紧张局势爆发:比特币现金会流向另一支“灾难性”叉子吗?2020-08-05
- Tik Tok,你大错特错2020-08-05
- 什么是哈希算法?2020-07-31
- NEAR区块链协议集成了Chainlink的数据Oracle2020-07-31