视觉大数据研究中心

2024-11-18

｜中心简介

视觉大数据研究中心专注于图像与视频等数据的智能分析基础与应用研究，让各种智能设备通过视觉感知和理解周围环境。

｜研究团队

目前研究团队有教授1名、副教授1名，助理教授3名、科研助理1名。

｜研究中心主任

沈琳琳教授

沈琳琳，爱思唯尔中国高被引学者、深圳市“鹏城学者”特聘教授、英国诺丁汉大学计算机学院荣誉教授，深圳大学计算机视觉研究所所长、深圳大学医学影像智能分析与诊断研究中心主任。

｜研究方向

大语言模型、多模态模型；深度学习理论、视觉知识表示与学习、融合小波等经典信号处理理论的神经网络架构与模块设计、弱监督物体检测与分割，人脸识别、表情、年龄等属性识别、抑郁与性格等情感分析，基于生成对抗网络、扩散模型的人脸合成，人脸、文本、声音等多种模态的互相生成与统一表征，以及各种医学影像智能分析。

｜合作单位

与高通、华为、广州数控、大华以及欧蒙等知名企业在计算机视觉领域广泛开展产学研合作。

｜科研成果

1）伶荔中文大语言模型

以LLaMA为模型底座，利用中文和中英平行增量预训练，将它在英文上强大语言能力迁移到中文上，开发了伶荔高性能中文基础模型。更进一步，汇总了目前公开的多语言指令数据，对中文LLaMA模型进行了大规模指令跟随训练，实现了问答大模型。目前日均浏览量6000，1600 Star，为GitHub热榜项目。

项目网址：https://github.com/cvi-szu/Linly

2）人脸识别/分析与生成

研究人脸识别算法、表情、抑郁、性格等各种人脸属性判别算法，基于生成对抗网络、扩散模型的变脸算法，以及基于文本描述的人脸生成算法。

人脸识别算法曾获ICPR准确率测试亚军，最新的200层神经网络人脸识别算法在MegaFace百万测试1:N和1:1准确率分别为99.27%和99.19%，达到业界最高，在带口罩人脸测试MFR Ongoing Challenge上综合性能超过98%，目前也是业界最高。

人脸运动单元检测算法获CVPR 2023第5届人脸运动单元检测挑战赛学术组第2名！

3）虚拟人驱动与合成技术

研究虚拟人合成技术，根据说话文本、语音合成说话逼真的虚拟人视频，结合大语言模型合成自动问答虚拟人；在系列人脸生成技术基础上，研究三维人体/人脸实时驱动技术；在交互过程中理解对方情感，并生成相应表情的对话人脸反应。

4）医学图像智能分析

研究根据图像生成诊断报告的“伶荔医”医学大模型。

眼部OCT图像、鼻内窥镜图像、数字口腔及牙齿矫正、甲状腺肿瘤B超图像、胸部X光图像、肠胃内窥镜图像、肾脏CT图像以及组织病理和细胞病理等医学图像智能分析算法，并结合临床诊断、检验化验数据开展多模态疾病诊断/预后等计算机辅助精准医疗方法的研究。

｜成果转化

除了将研究成果以学术论文形式发表，研究中心还和多家公司进行了产学研合作，成功将上述成果应用于基于人脸识别的人证核查设备/平台、基于高通骁龙以及华为昇腾芯片边缘设备以及智能制造中的OCR和自动点料设备，累计产生经济效益约8.5亿元，具体成果如下：

在人脸识别领域，和企业合作，联合开发基于人脸识别的人证核查设备。设备在深圳高交会、双创周以及司法考试、办公大楼、居住小区和学校入口门禁得到成功应用，同时远销新疆杭州等地用于城市卡口反恐，G20峰会期间的城市安全、酒店入住身份核查等领域。新冠疫情期间推出结合人体测温的门禁和道闸通关系统，在数十万个办公大楼、小区和学校应用，为新冠传播监测和防控做出了重要贡献。

联合深圳企业，将人脸认证以及活体检测算法广泛应用于山西、山东以及贵州等省民生工程的社保认证、服务平台，在人脸实名认证的基础上实现基于互联网的农村居民社保缴纳、领取等民生服务，在安全、便利前提下有效杜绝社保欺骗和诈骗。

合作开发基于人脸识别的网络身份认证云平台，广泛应用于银行支付、金融借贷以及保险等领域的身份认证，高峰期每天认证业务量200多万笔。

在边缘计算及智能终端领域，连续承担高通公司“一体化人脸分析”、“凝视与头部姿态检测”、“人脸检测”以及“人体部位检测”等高校合作项目，研发适配于骁龙芯片的高性能视觉算法。连续承担华为公司“昇腾处理器AI模型”、“MindSpore纵智昇腾310推理”及“MindSpore ModelZoo 网络”等合作开发项目，完成了ResNet_Inception_v2、MobileNet v3 large等经典物体分类网络，以及SSD_ResNet50、FaceBoxes等经典物体检测在MindArts、昇腾910和310平台上的移植与部属。上述模型广泛应用于配备高通骁龙及华为昇腾芯片的智能终端及边缘设备。

在智能制造领域，承担 “产品外包装文字检测与OCR识别”以及 “SMT电子料盘自动计数”等研发项目，将AI技术应用于生产线上的外包装自动文字识别，以及SMT电子备件的出库入库自动清点，代替人工后大大提高了生产效率，节省了人力成本。

｜承担项目

[1] 国家自然科学基金国际合作研究项目，82261138629，可信AI驱动的下一代新冠肺炎精准医疗，2023/01-2025/12，200万元，在研，主持。

[2] 国家自然科学基金重大研究计划，91959108，基于多数据融合深度网络的甲状腺肿瘤精准诊断，2020/01-2022/12，73万元，结题，主持。

[3] 国家自然科学基金-深圳机器人基础研究中心项目，U1713214，服务机器人的主动环境认知与目标行为识别，2018/01-2021/12，300万元，结题，深圳大学负责人。

[4] 国家自然科学基金面上项目，61672357，三维Gabor特征空间编码与融合方法研究，2017/01-2020/12，62万元，结题，主持。

[5] 国家自然科学基金青年--面上连续资助项目，61272050，过完备字典自适应优化理论及应用研究，2013/01-2016/12，60万元，结题，主持。

[6] 国家自然科学基金青年科学基金项目, 60903112，基于过完备感知模型和稀疏表示的有遮挡人脸识别研究，2010/01-2012/12，18万元，结题，主持。

[7] 广东省科技计划项目，2018A050501014，基于人工智能的老年人医疗服务平台，2018/08-2021/12，100万元，结题，主持。

[8] 华为公司横向项目，MindSpore ModelZoo网络技术，2021.12-2022.06，结题，主持。

[9] 华为公司横向项目，华为昇腾处理器AI模型部署，2020.12-2021.06，结题，主持。

[10] 美国高通公司高校合作项目，基于GAN的人脸编辑，2022.03-2023.03，结题，主持。

[11] 美国高通公司高校合作项目，人脸及身体躯干检测，2020.12-2021.12，结题，主持。

[12] 美国高通公司高校合作项目，人脸检测，2019.09-2020.09，结题，主持。

[13] 美国高通公司高校合作项目，凝视和头部姿态检测网络，2019.09-2020.09，结题，主持。

[14] 美国高通公司高校合作项目，一体化人脸分析网络，2018.06-2019.05，结题，主持。

[15] 美国高通公司高校合作项目，多任务人脸分析深度网络，2017.03-2019.03，结题，主持。

[16] 深圳市科技创新委项目-2019年后基础研究（面上项目）：多粒度模糊知识推理理论及应用，2021-2024，在研，主持。

[17] 广东省科技计划项目-广东省自然科学基金面上项目：基于粒计算的不确定性分析及其在废旧纺织品分类中的应用，2021-2023，结题，主持。

[18] 国家自然科学基金项目-面上项目：面向高维动态大数据的多粒度知识协同及推理，2021-2024，在研，主持。

[19] 广东省科技计划项目-广东省自然科学基金博士启动：多值决策下的知识发现及不确定性推理研究，2018-2021，结题，主持。

[20] 广东省科技计划项目-广东省自然科学基金面上项目：面向多模态图文数据的通用小样本目标检测算法研究，2024-2026，在研，主持。

[21] 国家自然科学基金项目-青年科学基金项目：结合开放数据集的自监督小样本元学习目标检测，2024-2026，在研，主持。

机构设置

机构设置

内设中心

｜中心简介

1）伶荔中文大语言模型

｜成果转化

｜承担项目

详细地址

联系电话

电子邮箱

微信公众号

机构设置

机构设置

内设中心

｜中心简介

1） 伶荔中文大语言模型

｜成果转化

｜承担项目

详细地址

联系电话

电子邮箱

微信公众号

1）伶荔中文大语言模型