潘云鹤:“视觉知识”推动AI 2.0突破

  • 时间:
  • 浏览:1
  • 来源:极速3分彩_一分快三助赢计划app

调查大什么的问题加载中,请稍候。

若长时间无响应,请刷新本页面

  记者 韩扬眉

  人类对世界的认知中,150%的信息来自视觉,亲戚亲戚你这个人希望人工智能未来都都能能像人一样敏锐地观测、认知和预测世界。在中国工程院院士潘云鹤看来,实现视觉知识表达、推理、学习和应用的技术将是人工智能(AI)2.0取得突破的重要方向之一。

  近日,潘云鹤首次系统地提出“视觉知识”概念,在接受《中国科学报》专访时对其进行了具体阐述和解释。

  《中国科学报》:您提出视觉知识你这个 概念的背景是你这个 ?

  潘云鹤:视觉处理技术对AI发展有重要影响。

  首先,近年来,图像识别水平的快速提升推动了AI热潮的形成。图像识别技术的突破不仅提高了计算机对人脸、文字、指纹及生物底部形态、医学图片等识别的准确率,随后进一步推动了智能制造等领域的发展。中国科学技术发展战略研究院按技术分类对2018年中美AI企业数量进行了统计,都都能能 看出,提供和应用图像识别技术的企业占一半以上。

  其次,传统的知识表达法律方式有显著存在问题。早期图像识别和计算机视觉建立在图像处理技术之上;强度神经网络的使用以数据驱动的法律方式来学习底部形态表达,有效提高了图像分类和识别的准确率。

  不过,作为AI知识表达的三种法律方式,强度神经网络难以解释、不可推理,以及因需几瓶标识的数据训练网络参数而难以处理地会引入数据偏见等存在问题。随后,亲戚亲戚你这个人时需研究三种全新的知识表达——视觉知识。

  这启示亲戚亲戚你这个人,数字视觉领域是推动AI发展的重要领域;更好的知识表达是推动数字视觉发展的关键技术;克服强度神经网络存在问题是“视觉知识”研究的关键方向。

  《中国科学报》:你这个 是视觉知识?它有你这个 底部形态?

  潘云鹤:视觉知识是知识表达的三种新形式,它能表达世界的时空底部形态与变化底部形态。计算机图形学经过长期发展,提供了视觉知识表达与操作的技术基础。随后,对视觉知识进行表达及其推理等操作,还需在此基础加进以改造与重构。

  视觉知识与迄今为止人工智能所用知识表达法律方式不同。视觉概念具有典型与范畴底部形态、层次底部形态与动作底部形态等要素。视觉概念能构成视觉命题,包括场景底部形态与动态底部形态。视觉命题能构成视觉叙事。重构计算机图形学成果可实现视觉知识表达及其推理与操作,重构计算机视觉成果可实现视觉知识学习。

  实现视觉知识表达、推理、学习、使用的理论和技术将是AI 2.0取得突破的重要方向之一。

  视觉知识意味着着难以用语言符号表达,曾被统归为常识,而以往AI研究的一大弱点便是视觉知识研究存在问题。随后,视觉知识的研究与运用意味着着是AI 2.0的两个 多 重要发展方向。

  《中国科学报》:如保构建视觉知识体系?

  潘云鹤:视觉知识体系构建与利用时需处理的首要大什么的问题是视觉知识学习,这也是两个 多 知识学习的无人区。建立两个 多 系统的知识体系,往往更时需自顶向下的设计,在你这个 过程中,诸如3D底部形态重建等计算机视觉研究成果为系统的视觉知识学习提供了发展土壤。

  不过,视觉知识学习要将目标从视觉底部形态重建进一步深入到视觉知识重建,还时需对现有计算机视觉技术作进一步研究,比如,重建3D底部形态的层次底部形态,定位其在概念范畴中的位置等。

  除了视觉概念,时需研究视觉命题与视觉叙事的表达和学习。

  《中国科学报》:视觉知识有你这个 应用?

  潘云鹤:从当前AI热潮中视觉识别技术的广泛渗透,可推知视觉知识的应用极广。这里我举例说明视觉知识的各种应用。

  基于知识的识别法律方式,如用于图像识别。相似“猫”,根据“猫”的视觉概念的典型与范畴等,使用综合推理法律方式自动生成猫的范畴内外各种图像大数据,并根据范畴内外自动标识为正、负范例。随后,用上述范例大数据训练多层神经网络,最后,用训练过的多层神经网络识别图像。

  事实上,视觉知识有着独特的优点,都都能能提供综合生成能力、时空比较能力和形象显示能力,而你这个 正是字符知识所存在问题的重都都能能力。它们能在创造、预测和人机融合等方面为AI新发展提供基础动力。

  《中国科学报》:关于视觉知识,未来,亲戚亲戚你这个人时需关注的重点还有你这个 ?

  潘云鹤:建设视觉知识词典将是十分重要的,这是两个 多 巨大而实用的知识平台和数据平台,应当联合全球人工智能、计算机图形学和计算机视觉科技工作者同時 建设。为了顺利而高效地完成视觉知识词典的建设,群智组织模式不可或缺。

[ 责编:宋雅娟 ]

阅读剩余全文(