重庆海天软件工程学院 海天瑞声深度解析?

来源:安成教育咨询网 时间:2023-10-08 23:10:16 责编:教育顾问 人气:


重庆海天软件工程学院 海天瑞声深度解析? 第1张


海天瑞声深度解析?

海天瑞声属于科创板上市公司,主营软件开发和信息技术服务。

公司历来重视研发、技术工作,近年来更是加大研发投入的力度,全面提升公司的算法能力、工程化数据生产能力,持续加深算法辅助能力与人工工作的结合,达到更佳的人机协作,不断向训练数据生产智能化方向演进,助力公司做大规模、提升效率、降低成本。经过长期积累,公司在平台工具方面总体处于行业领先地位,一方面是基于公司持续且不断加大的研发团队建设和研发投入,另一方面是基于公司在训练数据领域多年积累下大量、多元化数据以及数据应用经验,通过这样的积累,持续迭代平台工具的适用性,并持续训练底层算法,形成适配性和功能性都更优的模型,可以做到少量数据注入->算法训练->标注员反馈->模型生成->处理大量数据的自闭环体系,在数据处理这个场景下,实现最佳的算法和平台能力,并驱动公司整体研发与技术实力不断迭代向前。2022年上半年,公司成功入选中国国际大数据产业博览会“十佳大数据案例”,该案例评选工作为我国大数据技术攻关、应用及模式创新起到了产业引领作用,充分展示出公司在数据技术自主创新和融合应用上的最佳实践。

标准化数据集产品资源积累深厚、独具优势

标准化训练数据集产品的知识产权由公司享有,具有一次性研发生产、可重复多次销售的特点,是公司区别于众多竞争对手的一个优势亮点。报告期内,公司新增研发百余个训练数据集产品,自有知识产权的训练数据产品储备超过1,050个,全面覆盖智能语音、计算机视觉、自然语言、智能驾驶等业务线。持续构建标准化训练数据集产品资源集群一直是公司坚持的重点方向之一,公司开发大量通用型、复卖率高的标准化数据集产品,通过多次授权售卖为公司带来持续性利润,实现训练数据产品的规模化效应。

拥有较强的语音语言学基础研究能力及丰厚沉淀

语音语言学领域的专业知识是构建高质量语音识别算法和语音合成算法的关键要素。经过多年积累,公司积累有深厚的语音语言学基础研究成果,并已将其运用至构建高质量的智能语音训练数据。在语音语言学基础研究领域,公司拥有丰富的多语种语言学家团队资源积累和多语种发音词典积累,以及不断创新的发音词典构建技术和流程技术。截止报告期末,公司已经拥有190个语种/方言的覆盖能力,不仅包括含英、法、德、意、西、日、韩等常见语种,还包括东南亚、一带一路等国家地区的罕见小语种,尤其在亚洲小语种的服务上具备竞争优势。同时,公司已积累下超过100个语种/方言的发音词典,覆盖希伯来语、乌尔都语、缅甸语、阿姆哈拉语、普什图语、阿尔巴尼亚语、格鲁吉亚语等小语种,累计词条数超过1,000万条,可支撑构建高质量的智能语音训练数据,是公司的主要壁垒及核心技术之一