欢迎光临KOTOO财情




人工智能也能成为你的“眼”?Facebook 测试能解读影像内容的 App VQA

2024-05-05 209

当你上传照片到 Facebook 后,通常系统会询问你是否要标注照片中的朋友,并提供 Facebook 所辨识出的人脸选项,让你省去搜寻朋友名字的麻烦,而往后的这项功能将会再进化升级了。Facebook 要将人工智能用在照片人脸辨识上,怎么说呢?未来当你点选 Facebook 上的某张照片时,Facebook 还能用语音告诉你照片中有什么。

在今年 3 月的年度开发大会 F8 上,Facebook 技术长 Mike Schroepfer 介绍了旗下人工智能团队(Facebook’s AI Research,FAIR )一手打造的“Memory Networks(MemNets)”技术,这项技术能让机器进行复杂的问答对话,当时 Schroepfer 现场展示了 MemNets 系统,先让机器读取《魔戒》一书的内容摘要资讯,接着再提出如“魔戒被拿到末日火山前被带到哪里”这类与魔戒有关的复杂问题,MemNets 系统能够从先前读取的内容摘要中,找到符合问题的答案,进而回答问题。

而现在,Facebook 正在测试的 app“VQA(Visual Q&A)”,利用 Facebook 的影像辨识技术结合 MemNets 系统,让机器能辨识照片中各个不同的部分,并回答使用者所提出的、关于照片内容的各种问题。

例如,在 Facebook 上出现小孩的照片,你可能会问 VQA,“小孩现在在哪里呢?”或是“小孩在干嘛呢?”,这时,VQA 便会回答你,“小孩正在浴室”或是“小孩正在刷牙”。

下方为 VQA 技术的示范影片:

 

Visual Question and Answering DemoEarlier this year, we showed some of our work on natural language understanding — specifically, a system called Memory Networks (MemNets) that can read and then answer questions about short texts. In this demo of a new system we call VQA, or visual Q&A, MemNets are combined with our image recognition technology, making it possible for people to ask the machine what’s in a photo.

由 Facebook Engineering 贴上了 2015年11月3日

 

VQA 对视力有缺损的人来说,无疑是其接触社群平台的一大帮助。如 Schroepfer 所说,“想像你是视力缺损者,对你来说,要在社群平台上与朋友交流,得依靠视力才能全然参与其中。而你其中一位朋友,捕捉自己刚出生的小孩影像,即便现在已经有科技能读出社群平台的文字,但你却缺少了解照片内容的辅助工具”,这时候,VQA 功能就能为视力受损者带来不少便利。

延伸阅读:

  • 人工智能靠真人训练? Facebook 数位助理“M”背后还躲著一票真人
  • 科技公司的新斗争角力:人工智能!苹果在 4 天内买下两家相关科技公司
  • 最新研究:目前人工智能拥有等同于 4 岁儿童的智商
2019-03-23 15:31:00

标签:   资讯头条 kotoo科技资讯 kotoo科技 kotoo科技资讯头条 科技资讯头条 KOTOO商业产经 新闻网 科技新闻网 科技新闻 Kotoo科技新闻网 Kotoo Kotoo科技新闻网 科技新闻 科技新闻网 KOTOO商业产经 科技资讯头条 kotoo科技资讯头条 kotoo科技 kotoo科技资讯 资讯头条 Kotoo Kotoo科技新闻网 科技新闻 科技新闻网 新闻网 KOTOO商业产经 kotoo科技资讯头条 kotoo科技 kotoo科技资讯 资讯头条
0