专利名称:语音处理方法和装置专利类型:发明专利发明人:丁国宏,蔡玉玉,青飞申请号:CN202011492877.9申请日:20201217公开号:CN112669855A公开日:20210416
摘要:本申请公开了语音处理方法和装置,涉及人工智能技术领域,进一步涉及语音处理技术领域。具体实施方式包括:将目标语音分成多个第一片段;将多个第一片段分别输入训练后的神经网络,生成多个第一片段分别对应的特征向量,得到多个特征向量;由多个特征向量,确定出至少两个特征向量作为说话人向量;对于多个说话人向量中的说话人向量,获取该说话人向量与各个特征向量的相关度,并根据相关度对多个第一片段进行迭代聚类,生成不同类别的第一片段之间的分割点;根据分割点,将目标语音或多个第一片段分成至少两个第二片段,其中,每个第二片段对应一个说话人。本申请通过迭代聚类的方式使得不同说话人的特征向量逐渐收敛,实现准确性更高的说话人分离。
申请人:北京沃东天骏信息技术有限公司,北京京东世纪贸易有限公司
地址:100176 北京市大兴区经济技术开发区科创十一街18号院2号楼4层A402室
国籍:CN
代理机构:北京英赛嘉华知识产权代理有限责任公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容