工作職責(zé):
對(duì)海量音頻信息進(jìn)行分析和信息提取。
崗位職責(zé)主要包括:
1. 方言語音識(shí)別,對(duì)視頻等場(chǎng)景中的方言進(jìn)行語音識(shí)別
2. 音頻分類,音頻事件檢測(cè),對(duì)音視頻文件中的有效內(nèi)容進(jìn)行標(biāo)簽提取,特別是語音文字之外的信息提取;
3. 語種識(shí)別,說話人識(shí)別,提升已有系統(tǒng)在復(fù)雜場(chǎng)景(噪聲,遠(yuǎn)場(chǎng),混響)中的魯棒性;
4. 說話人Anti-Spoofing,提升虛假音頻攻防對(duì)抗的識(shí)別能力。
任職要求:
1. 碩士或及以上學(xué)歷,計(jì)算機(jī),信號(hào)處理、模式識(shí)別,自動(dòng)化相關(guān)專業(yè);
2. 了解聲紋識(shí)別,語種識(shí)別,音頻事件檢測(cè)或語音識(shí)別領(lǐng)域的技術(shù)發(fā)展情況,掌握主流算法,有過開發(fā)實(shí)際系統(tǒng)或其中某一模塊(前端、特征、建模、匹配)的經(jīng)歷;
3. 扎實(shí)的機(jī)器學(xué)習(xí)和模式分類功底;
4. 熟練掌握 C/C++或Python, 編程能力強(qiáng);熟悉 Linux 環(huán)境開發(fā);
5. 對(duì)Kaldi、Pytorch、TensorFlow(至少其一)熟練使用;
6. 參加NIST等評(píng)測(cè)比賽取的較好名次者優(yōu)先;
7. 良好的溝通能力與團(tuán)隊(duì)協(xié)作精神;
8. 在ICASSP, INTERSPEECH, ASRU, CSL, Speech Communication等知名會(huì)議和期刊發(fā)表過論文者優(yōu)先