中国专利搜索 世界专利搜索 专利分类查询 专利引用检索 专利族检索
登陆 | |

基于偏差器官形态行为可视化的口语学习矫正方法
有权
阅读授权文献

Oral Language learning correction method based on deviation organ morphology and behavior visualization

申请号:201810624822.5 申请日:2018-06-17
CN201810624822
CN108922563A
微信扫码查看/分享专利
摘要:本发明是一种基于偏差器官形态行为可视化的口语学习矫正方法。通过对学习者发音时的音素、重读、词间停顿和语调与标准音进行对比,计算学习者发音准确度以及发音器官行为与标准行为的偏差,可视化地展示给学习者。主要步骤是S1.采集学习者和标准音的发音信息,对所述采集信号进行预处理,提取特征;S2.构建句子的标准发音器官形态行为库,将标准音的发音特征映射到所述器官形态行为库;S3.计算学习者发音的音素、重读、停顿和语调与标准音的相似度,计算出器官行为的偏差值,可视化的展示给学习者;S4.综合四个指标对学习者的发音评分并反馈给学习者,提升学习效率。
Abstract: The invention discloses an oral Language learning correction method based on deviation organ morphology and behavior visualization. By comparing phonemes, stress, between-word pause and intonations ofa learner during pronouncing with a standard pronunciation, the pronouncing accuracy of the learner and the deviation between pronouncing organ behavior of the leaner and standard behavior are calculated and displayed to the learner visually. The oral Language learning correction method comprises the main steps that S1, pronouncing information of the learner and pronouncing information of the standard pronunciation are collected, collected signals are preprocessed, and features are extracted; S2, a standard pronouncing organ morphology and behavior library of sentences is established, and thepronouncing features of the standard pronunciation are mapped to the organ morphology and behavior library; S3, the similarity between the phonemes, the stress, the between-word pause and the intonations of a pronunciation of the learner and the standard pronunciation is calculated, and the deviation value of the organ behavior is calculated and displayed to the learner visually; and S4, the fourindexes are synthesized to give a mark of the pronunciation of the learner, and the mark is fed back to the learner. Therefore, the learning efficiency is improved.
申请人: 海南大学
Applicant: UNIV HAINAN
地址: 570228 海南省海口市美兰区********(隐藏)
发明(设计)人: 段玉聪 宋正阳 张欣悦
Inventor: DUAN YUCONG; SONG ZHENGYANG; ZHANG XINYUE
主分类号: G10L25/51(2013.01)I
分类号: G10L25/51(2013.01)I G10L25/69(2013.01)I G10L15/02(2006.01)I G10L15/10(2006.01)I G10L25/18(2013.01)I G10L25/24(2013.01)I G09B5/06(2006.01)N
  • 法律状态
2019-09-24  授权
2018-12-25  实质审查的生效IPC(主分类):G10L 25/51申请日:20180617
2018-11-30  公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
  • 其他信息
主权项  1.本发明提出一种基于偏差器官形态行为可视化的口语学习矫正方法,通过计算学习者对句子的发音信息和标准音做对比,给出学习者的发音评分,如果发音不准确,将定位发音不准确的位置,反馈给学习者标准的发音以及可视化的告诉学习者发音器官动作;具体地,将原始语音信号经过处理得到切分的单词和组成单词的音素的Mel倒频谱系数,计算学习者的音素发音和标准音素发音的Mel倒频谱系数特征的欧几里得距离评估相似度,通过平均短时能量评估学习者发音的重读准确度,通过DTW算法评估学习者的语调发音准确度,通过基于短时能量和过零率的检测方法评估学习者的词间停顿准确度;本发明是一种基于偏差器官形态行为可视化的口语学习矫正方法,其特征在于包括:S1.采集学习者对学习句子的发音信息以及标准发音信息,对所述采集信号进行预处理,提取特征;S2.构建标准发音器官形态行为库,将标准音的特征映射到标准发音器官形态行为库;S3.将采集的学习者的发音信息和标准音信息进行对比,计算句子的音素、重读、词间停顿和语调与标准音的相似度;若相似度大于阈值,则认为发音准确,若小于阈值,则认为发音不准确,计算不准确发音的器官形态行为与标准行为的偏差,并定位发音错误位置,用可视化的方式展示给学习者正确的发音以及正确发音的器官行为偏差;S4.根据音素、重读、词间停顿和语调相似度计算学习者对句子发音的综合评分,判断学习者该次句子发音的综合得分,并反馈给学习者。
公开号  108922563A
公开日  2018-11-30
专利代理机构  
代理人  
颁证日  
优先权  
 
国别 优先权号 优先权日 类型
CN  201810624822  20180617 
国际申请  
国际公布  
进入国家日期  
  • 专利对比文献
类型 阶段 文献号 公开日期 涉及权利要求项 相关页数
SEA  CN102169642A  20110831  1-4  说明书24-51段、附图1-4 
SEA  CN103617799A  20140305  1-4  说明书第70-191段 
SEA  CN105825852A  20160803  说明书第4-23段 
SEA  CN107578772A  20180112  1-4  全文 
注:不保证该信息的有效性、完整性、准确性,以上信息也不具有任何效力,仅供参考。使用前请另行委托专业机构进一步查核,使用该信息的一切后果由用户自行负责。
X:单独影响权利要求的新颖性或创造性的文件;
Y:与检索报告中其他 Y类文件组合后影响权利要求的创造性的文件;
A:背景技术文件,即反映权利要求的部分技术特征或者有关的现有技术的文件;
R:任何单位或个人在申请日向专利局提交的、属于同样的发明创造的专利或专利申请文件;
P:中间文件,其公开日在申请的申请日与所要求的优先权日之间的文件,或会导致需核实该申请优先权的文件;
E:单独影响权利要求新颖性的抵触申请文件。
  • 期刊对比文献
类型 阶段 期刊文摘名称 作者 标题 涉及权利要求项 相关页数
SEA  《第十三届全国人机语音通讯学术会议(NCMMSC2015)论文集》  宋瑞等  《可视化英语语音矫正研究—以藏语语者英语单元音矫正为例》  1-4  第1-5页 
宋瑞等: "《可视化英语语音矫正研究—以藏语语者英语单元音矫正为例》", 《第十三届全国人机语音通讯学术会议(NCMMSC2015)论文集》 
  • 书籍对比文献
类型 阶段 书名 作者 标题 涉及权利要求项 相关页数