麻省理工卷积神经网络:能恢复模糊图像中的清晰信息

发布:cyqdesign 2019-10-18 08:31 阅读:1791
据外媒报道,麻省理工学院(MIT)的科学家们找到了一种可以在运动模糊的视频帧中恢复细节并重现清晰图像的方法。这套“视觉投影模型”通过使用卷积神经网络(CNN)来解码图像。 *rB@[ (/  
=yoR>llbBC  
MIT计算机科学和人工智能实验室(CSAIL)的研究人员通过扫描数千对图像(投影)训练CNN,其中一幅图像质量较低,另一幅图像则图像模糊。神经网络利用这些信息然后通过学习像素模式和像素来源从本质上逆转模糊效果。 Ikw.L  
 \< dg  
CNN的另一部分责备称为“变分自动编码器(variational autocoder)”,它能够分析输出并评估网络跟信号的匹配程度。随后,它则会创建一幅“蓝图”告诉AI如何对一个投影到所有可能的匹配源进行处理。当给定一幅新图像时,CNN会检查像素模式并使用该蓝图寻找可能导致模糊的每个信号,然后它组合数据创建一个“高维”副本。 `VvQems  
(F9e.QyWb  
打个比方,在一段显示一辆汽车飞驰而过的视频中你可能能分辨出那辆车是红色的,但除此之外其他的信息则都不清楚。而视觉投影模型可以获取这些素材并创建一个足够清晰的复制品来识别制作和模型。 4* I XBi7%  
:X:s'I4J D  
这篇论文的首席作者、CSAIL的博士后Guha Balakrishnan表示:“对于我们能够恢复这些细节就像变魔法一样。” hwA&SS  
pjQyN|KS  
实际上,研究人员对它在医学领域的作用更感兴趣。他们相信这项技术可以被用来制造类似于X射线CT的3D扫描。这一突破将能显著降低成本,因为MRI和CT设备都非常昂贵。该软件将能够从成本相对较低的X射线等低信息图像中重建出高信息图像。 An^)K  
y#8 W1%{x  
“如果我们能将X射线转换成CT扫描,那将在某种程度上改变游戏规则,”Balakrishnan说道,“你只需拍一张X光片,然后通过我们的算法就能看到所有丢失的信息。”
分享到:

最新评论

我要发表 我要评论
限 50000 字节
关于我们
网站介绍
免责声明
加入我们
赞助我们
服务项目
稿件投递
广告投放
人才招聘
团购天下
帮助中心
新手入门
发帖回帖
充值VIP
其它功能
站内工具
清除Cookies
无图版
手机浏览
网站统计
交流方式
联系邮箱:广告合作 站务处理
微信公众号:opticsky 微信号:cyqdesign
新浪微博:光行天下OPTICSKY
QQ号:9652202
主办方:成都光行天下科技有限公司
Copyright © 2005-2024 光行天下 蜀ICP备06003254号-1