Research
当前位置: Home>>Research

 


非结构化环境中的3D实例目标检测

 
非结构环境(一种没有明确结构、不规则的环境,即目标周围的环境信息非固定,不可知)三维实例级物体的检测在智能监控,视觉导航,人机交互,智能服务等领域有着重要的应用。为实现目标检测中的两个关键的子任务:目标识别和目标定位,
(1)  利用传统机器学习方法,设计实现了级联式分类器,在复杂多变的应用环境(多视角,多尺度,不同背景,不同光照条件)下,算法能以平均20fps 的处理速率得到高于80%的平均召回率(recall)与准确率(precision);
(2)  利用深度学习方法,采用生成式反卷积网络GDDNE与对抗生成式网络AGR-FCN相结合的策略,与另一款设计的保持特征向量独立性的半监督神经检测网络SVD-RCNN一样,只需要5%的手工标注训练数据外加95%的生成式标注数据或非标注训练数据,就可获得与使用100%手工标注的真实训练数据进行训练后相当的检测精度效果。
 

视觉导引中的PTZ摄像机在线标定及目标跟踪技术

 

 
1)PTZ相机无靶标在线实时标定
通过PTZ相机在Pan-Tilt前后各拍摄一副场景图像,求解两幅图像之间的单应性矩阵并构建一系列Givens矩阵对其进行分解,最后求解得到PTZ相机全部内参数。特点:不需任何靶标,在线实时,精度与张正友标定法相当。
2)基于PTZ摄像机的智能教学跟踪系统
利用所提出的一种适用于长期跟踪的单目标跟踪算法IRF-TLD,该系统中单目PTZ摄像机能实现教室内走动式教学老师的跟踪,且不受投影仪、电子白板的投影像的运动影响,具有较好的稳定性和实时性。
3)基于变换域的动场景中小运动目标跟踪方法
基于小波变换的小目标(目标图像的半径为2到14个像素,图像中的速度为50到200个像素每秒)跟踪,结合EM参数估计技术,可实现跟踪相互之间有干扰的多个目标。 
 
 

 模糊图像类型辨识及图像去雾技术研究

 

 

 
 
 

模糊图像分类是模糊图像复原获取高质量图像的前提条件,是视觉系统的重要组成,利用传统的机器学习(集成SVM)和深度学习(CNN)等方法实现了4种模糊图像(离焦、运动、高斯、雾天)的快速准确分类。

对户外雾霾天气下采集的降质图像进行去雾处理是保证户外视觉系统稳定工作的必要手段。利用大气点扩散函数(APSF)作为卷积核,建立了基于多散射的雾天成像模型,实现了图像域下APSF核函数的近似
估计。改进了传统暗原色去雾方法,提出了鲁棒性高,实时性好的基于超像素分割获得景深一致的图像去雾方法。
 
 
 
 
 
 


医学图像处理

 

 

 

 

 

 

采用SVM方法进行特征选择和分类识别,与美国康涅狄格大学合作,实现了预测准确率达94.59%早期卵巢癌的辅助诊断;与北大医学部康复科合作,用机器学习以及深度学习的方法评估骨骼肌的萎缩程度,辅助康复与治疗。