研究背景与战略意义
在国家 “十四五” 信息无障碍建设战略号召下,文化普惠与数字包容成为推动包容性数字社会发展的重要目标。当前,传统无障碍电影制作依赖人工完成,存在成本高、周期长的显著瓶颈,难以高效满足视障、听障群体对影视艺术平等享受的需求,也制约了全球无障碍影视产业的规模化发展。在此背景下,研发基于人工智能技术的无障碍电影智能制作系统,不仅是响应国家战略、践行 “科技向善” 理念的关键举措,更是通过技术创新弥合感官鸿沟、为全球信息无障碍事业提供中国方案的重要实践,具有重大的社会价值与战略意义。
核心研究内容与技术路径
实验室以 “AI + 信息无障碍” 为核心方向,深度融合人工智能、多模态理解与大语言模型技术,构建无障碍电影智能制作系统 EagleMovie。核心研究内容聚焦三大关键技术环节:一是高精度字幕识别技术研发,通过算法优化实现 98.10% 的识别精度,确保影视内容信息精准提取;二是多模态旁白生成技术攻关,结合影视画面语义理解与听觉适配需求,生成符合视障群体感知习惯的旁白内容;三是全流程智能优化技术构建,打通 “字幕识别 - 内容解析 - 旁白生成 - 音轨合成” 全链路,实现国产化技术替代,从技术层面突破传统制作模式局限。
已取得的研究成果与优势
系统研发已取得多项突破性成果,核心性能与技术水平处于全球领先地位:在制作效率上,通过全流程智能优化,单部电影无障碍化制作耗时从传统 35 小时缩短至 16.3 小时,效率提升 50%;在技术认可上,相关技术成果入选 2022-2023 年度信息无障碍创新成果典型案例(全国仅 20 例),并获信息无障碍领域顶级会议 Web4All 2024 “最佳通讯论文奖候选”;在功能拓展上,系统具备多语言生成能力,可适配全球不同地区无障碍影视制作需求,相比传统人工制作方案,具有精度高、效率快、适配性强的显著优势。
成果转化与应用
目前,EagleMovie 系统已成功实现成果转化,应用于影视作品的无障碍化改造实践,直接助力视障、听障群体突破感官限制,平等获取影视文化资源。未来,实验室将进一步推动系统在文化、教育等更多领域的应用拓展,同时依托系统的技术输出能力,向全球无障碍影视制作机构提供高效、精准的解决方案,加速 “中国技术” 向 “全球普惠成果” 的转化,以技术创新推动信息无障碍事业发展,为构建包容性数字社会提供有力支撑。