北京时间6月23日消息,在周一于美国佛罗里达州迈阿密市举行的“计算机视觉和图案识别”技术大会上,谷歌技术人员宣布,该公司已在图片搜索技术上取得了重大突破。
科学家指出,人类在观看各类图片时,人脑可迅速根据图片内容而识别出全球各种标志性建筑,如万里长城、金字塔等等。但计算机却没有这么“智能。任何图片,如果缺乏相应文字说明,则计算机根本无法识别图片内容代表着现实生活中的何种事物。
谷歌周一称,利用该公司最新开发的图片识别技术,计算机可迅速识别出全球5万个以上知名地标性建筑,识别准确度高达80%。
谷歌表示,目前这项图片识别技术仍处于实验室开发阶段,近期内还不会投入商用。业界人士称,这项技术80%的识别准确率,确实还达不到商用要求。尽管如此,如果谷歌今后能够进一步提高相应识别准确率,则这种基于图案分析的搜索服务无疑将有着巨大市场增长潜力。
举例来说,如果普通旅游者前往旅游胜地,在遇到自己并不清楚的名胜建筑时,只需用数码相机或智能手机拍摄该建筑的图片,然后把该图片同谷歌图片搜索引擎的内容进行对比,就可了解到该建筑的具体来历。此外,谷歌这项图片搜索技术也可广泛用于科研和消费者日常生活当中。
工作原理
谷歌计算机视觉研究部门主管杰伊·亚格尼克(Jay Yagnik)近日在一则博客中阐述了谷歌图片搜索服务的大致工作原理:首先从谷歌Picasa和Panoramio两项图片服务中提取数量达4000万张、已被加上GPS(全球定位系统)标签的图像。然后再把这些图片同各种旅游信息网页进行匹配,以组成全球地标性建筑的列表。
其次,谷歌将为每个地标性建筑查找候选图片,然后再利用对比技术,为谷歌搜索引擎提供最为匹配的图片。最后一步,是为这些图片的快速识别开发出相应检索系统。
业界人士称,从本质上看,目前各类图片搜索引擎并不是查找图片内容本身,而是查找该图片所对应的说明文字。由此看来,谷歌地标性建筑图片搜索服务投入商用后,可视为“真正”图片搜索服务所迈出的第一步. |