浙江大学创新软件研发中心

InnovativE SoftwAre TechnoloGy DeveLopment CentEr, EAGLE-Lab

 

数据智能

数据智能

        AI已经成为了科技行业中“闪耀的新星”,并且在不断升温。当前市场上已经出现众多的AI应用。实验室在多个领域结合人工智能开展研究工作,包括医疗人工智能,5G智能行业,智能图文信息分析等。

在研方向:医疗人工智能

       目前医疗健康领域,人工智能已经在疾病辅助诊断等许多方面得到广泛应用,尤其是人工智能与医学影像的结合,已经成为医生诊断、治疗工作的一种必备手段。人工智能 + 医学影像是计算机在医学影像的基础上,通过深度学习与大数据技术等,完成对影像视频中人体器官目标检测、目标分割分类工作,进而提出诊断报告,协助医生完成诊断、治疗工作的一种辅助工具。人工智能在医疗影像领域的应用场景重点是提升医生看病效率和诊断问题的准确率。

图为智能医疗影像识别

         除了智能医疗影像识别,实验室还在人体运动分析(人体行为智能识别)、智能手术导航进行研究。基于人体骨架的行为分析方法在面对复杂背景的行为视频时具有较好的鲁棒性,因而这一方法是当下人体运动分析的研究热点,也是未来具有潜力的研究方向之一。 深度摄像技术的发展使得人体运动的深度图像序列变得容易获取,结合高精度的骨架估计算法,能够进一步提取人体骨架运动序列。

        外科手术进入智能机器微创手术阶段,骨科手术机器人在人工智能技术助力下在提高手术精度、优化手术操作、减少手术损伤等方面具有重要意义,是实现骨科手术微创化和智能化的重要途径。定位导航是现有骨科手术机器人的核心功能:定位是指利用空间定位算法计算手术靶点的空间坐标,定位算法的精度直接影响手术的精度和效果;导航是指利用合理的交互方式引导医生完成手术操作,导航模式的便利性直接影响系统的临床适应性和有效性。

图为智能手术导航
在研项目:智能图文信息分析

        随着信息技术的快速发展,计算机视觉感知已成为人工智能时代下的关注核心,但有时图像中缺乏文字,对于图像含义的深入理解带来了巨大的困难。而当下大量的图文数据(rich-text image)中包含着图像载体形式的文字信息,对于视觉理解起到了巨大的辅助作用,充当着图文数据信息分析与理解的重要载体。

         我们致力于探索图文大数据下的信息分析,通过场景文字(Scene Text)分析+文本结构内容化的研究思想,结合基础深度学习理论,创新定义多维度,多层次下的图文理解研究,在盲人无障碍图像辅助理解,通用图像问答及图像翻译等应用中提供技术与算法支持。

         我们也与阿里巴巴达摩院视觉技术的OCR团队有着长期合作与学术交流,在电商,实拍文档,街景等图文数据场景中有着丰富的技术基础和经验积累;实验室也同步研发了一套基础的OCR线上实验平台并迭代更新,为相关研究与工程实践提供了良好的基础。

         具体的研究方向包括:OCR基础算法研究,图文结构理解与内容化等。

图为智能图文信息分析
在研方向:5G智能行业

        实验室具有通讯研发15年以上的研发背景的5G专家做导师,并将在5G+流程监控和产品质控,5G+数据挖掘,5G+智能流程优化,5G+智能仓储,5G+远程维护,5G+医疗中研究领域上进行突破性研究。

图为5G智能行业