目标检测

Object Betection

应用深度学习技术与领先的通用物体检测算法,有效检测视频中的动物、交通工具、商标、生活家具等常见物体。

我们的优势
迭代速度快
毫秒级响应的识别速度
独有的视频识别逻辑,极大的节约算力和功耗,性能更加稳定
识别准确率处于行业领先水平

应用场景:目标计算,目标搜索,视频场景分析,自动驾驶车辆监测等

Image Classification

图像分类

经过专业的算法训练,根据图像的语义信息将不同类别图像区分,输出标签及置信度。

我们的优势
亿级数据训练库
先进的特征提取算法
7大标签层级,48000+标签类别

应用场景:基于内容的图像检索和相册自动归类,医学领域的图像识别等

人体识别

Body Recognition

通过深度学习模型,准确识别人体相关信息,包括人物属性,行为及手势等。

我们的优势
定位人体的14个核心关键点
识别24种常见手势
识别人体15种属性信息

应用场景:金融、安防、智慧零售、驾驶员状态分析等

Face Recognition

人脸识别

基于消费级视频的算法策略,准确检测人脸关键点,识别人脸属性,进行人脸的识别比对及查找。

我们的优势
消费级视频的人脸识别
识别效率高,精准度业内领先
多种人脸属性检测,包括美妆发型等附加信息,满足不同业务需求

应用场景:敏感人物比对、美妆美颜、明星识别等

文本理解

Text Understanding

使用光学字符检测OCR与自然语言处理NLP技术,深度解析语义信息,让计算机拥有文字阅读与理解能力。

我们的优势
海量文本数据特征库
结合文本语义,解读文字情感
准确率高达91.5%以上
支持中/英/葡/法/德/意/西/俄/日/韩等多种语言识别
支持多场景下的文字检测识别

应用场景:文本信息分析提取,敏感内容智能识别等

Audio Understanding

音频理解

基于语音识别、自然语言处理等技术,按语音类音频和非语音类音频两个方向进行特征提取,支持多种实用环境: 近场/远场音频、车载音频、多语种、 多方言、音乐、噪音、不良音频识别等。

我们的优势
融合多种模型提取声音特征向量
智能除噪
可精准高效提取音频包含的所有内容并自动处理

应用场景:音乐识别、文字智能记录,智能音箱,字幕智能生成,影音内容监控等