
研究方向:数字内容生成和安全
办公邮箱:NisonYoung@163.com
个人简介:
杨继臣,华南理工大学信号与信息方向博士,教授,先后在华南理工大学、新加坡资讯通讯研究院和新加坡国立大学跟随贺前华教授、Kong-Aik Lee教授和新加坡工程院院士、IEEE Fellow李海洲教授做过博士后研究,广师大网络与信息安全专业方向硕士生导师,华南师范大学硕士生导师,广师大数字内容安全实验室的联合负责人。
目前主要研究领域为数字内容生成和安全:
(1)数字内容生成(数字人生成,人脸生成,语音合成,歌声合成,歌声转换,情感转换)
(2)数字内容安全(信号二分类:包括不限于 伪造语音检测,伪造人脸检测,伪造文本检测,异常检测)
(3)信号多分类(包括不限于 语音情感分类,人脸表情分类,基于大语言模型的文本情感分类)
(4)基于大模型的AI智能体开发
学术兼职(或社会兼职):
IEEE高级会员、中国计算机学会(CCF)高级会员、CCF语音对话与听觉专委会委员
IEEE/ACM Transactions on Audio,Speech and Language Processing(TASLP)的审稿专家
主要成果:
主持过国家自然科学基金青年基金、博士后科学基金、广东省自然科学基金、广东省教育厅项目2项、中央高校基本科研业务费2项等项目。近几年以第一作者或通讯作者发表SCI论文30多篇,其中国际顶刊8篇(在语音领域顶刊TASLP发表6篇、在信息领域顶刊TIFS发表1篇、在多媒体领域顶刊TMM发表1篇),以下是部分论文:
[1]Extraction octave spectra information for spoofing attack Detection, IEEE TASLP, 2019.
[2]Significance of subband features for synthetic speech detection, IEEE TIFS, 2020.
[3]Long-term modified magnitude-phase spectrumfor spoofing attack detection, IEEE TASLP, 2021.
[4] Audiovisual Dependency Attention for Violence Detection in Videos, IEEE TMM, 2023.
[5]Integration of audio‐visual information formulti‐speaker multimedia speaker recognition, DSP, 2024
[6]Adaptive-AVG-pooling based attention vision Transformer for face anti-spoofing, ICASSP, 2024.
[7]β-order energy-weighting modulation on spectral bins for replay speech detection, IEEE TASLP, 2025.