报道|AI数据赛道的云测数据究竟有何秘诀?

2021年04月29日

搜索云测数据,我们会发现其很明显的属性:专注于高质量、场景化的AI数据服务。作为Testin云测旗下AI数据采集标注业务品牌,云测数据沿袭了Testin云测的企业服务基因,在人工智能的数据采集和数据标注领域大放异彩,已然成为行业天花板。有人评价Testin云测的成功来自于“足够垂直,更足够清晰。”而云测数据的成功,或许就恰恰证明了这句话。

云测数据:交出几近满分的答卷

人工智能的发展由数据、算法、算力“三驾马车”驱动。数据就如同人工智能这架快车的“油”,不断驱动着车辆前进。机器学习依赖大量的经过标注的数据,可以说数据标注让机器理解并认识世界,是人工智能发展过程中不可缺的一环,是AI金字塔构建的基础力量。

 

现阶段,国内能够独立做一站式、全链条数据服务,提供数据采标服务一体化的企业并不多。而在越发追求质量的数据采标领域,能够提供高标准、高精度 的数据服务的公司更是凤毛麟角。

为了实现高质量的数据采标服务,云测数据逐步建立起科学完善的技术模式和业务流程。据云测数据总经理介绍:“云测数据对高质量有两个维度的思考,一方面是数据的采集要与客户的需求紧密贴,另一方面就是数据标注的准确度。”

云测数据所做的每个项目都有一套完备的评估流程。“首先我们会基于专业领域的积累,对客户提出的数据需求进行评估分析,进行小规模试采试标,确保双方理解一致。再根据所得结果制定方案,细化流程。最后再进行数据量产,并在全过程中与客户进行持续的信息对接,保持双方对各个内容的一致。”

而标准化的业务流程是云测数据取得优异成果的基础,让他们在行业中大放异彩的还有两大法宝:数据场景实验室和数据标注基地。

数据采集:定制场景,精准还原

AI数据服务与人工智能技术的发展相辅相成。早在2010年,数据服务行业就开启了“野蛮生长期”,涌入了大量玩家,鱼龙混杂。到现如今的规范化发展阶段,伴随着需求升级,技术更硬核、效率度更高的专业AI数据服务将成为主流趋势。

 

数据采集作为数据标注的首要工作,在没有行业标准的情况下,无论是采集流程还是采集结果,都显得有一丝“随意”。伴随着AI的场景化落地,数据质量对算法越来越重要,粗放的数据采集已经跟不上人工智能企业的发展与新需求。

在采集需求复杂化的前提下,云测数据根据客户需求,不断进化数据采集方式方法,专注于场景化的数据采集服务。云测数据总经理表示:“现在简单的对一个需求进行数据采集是行不通的。人工智能正在走向产业落地,它所需求的数据是具象化、场景化的。比如我们对一个物体进行数据采集,不同的场景、光照等条件影响着算法的识别准确性。这提示我们,需要重构算法需要的场景,以帮助他们完成整个AI项目的落地。”基于这些现实考量,云测数据的场景化数据采集应运而生。

云测数据行业独创的“数据场景实验室”模式,可快速搭建各类复杂场景,包括且不限于驾驶、安防、新零售、家居生活等行业。云测数据曾在相关采访中表示,AI项目的场景定制化难在对场景还原的把控,比如采集自然光线下的曝光、强光或背光场景。以数据采集中难度较高的表情采集为例,云测数据放弃了过去在采集对象上的粗放选择方式,专门在横店设置了“数据场景实验室”,通过更为专业,也更高效的群演进行特定动作和表情的捕捉。

云测数据在进行了众多场景定制化数据采集工作后,俨然找到其中的规律和有效模式,到今天已经拥有了强大的场景化数据采集能力,可以深度还原AI场景落地所需数据,帮助各行业AI项目精准落地。

数据标注:更高精准度的领先实践

人工智能与数据标注的关系就如同学生与课本的关系,必须给他优质的教材和内容,才有可能把他培养成更优秀的人。在数据标注领域上,接近满分的精准度能够为人工智能带来质的飞跃。每一个人工智能产品在被应用到相应领域之前,最关键的环节就在于训练。“数据”作为至关重要的算法训练“原料”,从本质上决定了人工智能的智能水平。

 

在算法和算力没有重大突破的情况下,数据标注的精准度成为决定人工智能发展的关键要素。怎样才能取得高精确度?云测数据给出了他们的答案。

首先,云测数据对数据服务团队的专业化能力有着严格要求。

在云测数据,以智能客服单个场景的意图标注,就分为 10-20 个大类,上百个子类,根据业务需求可能还会有进一步的标注细分。尤其在医疗、法律、教育、智能驾驶等高度专业化的领域中,标注人员并不是随便找一个普通人员就可以做,标注人员需要非常专业,才能进行正确的数据标注与解读。

再次,在技术层面,云测数据对软硬件设施的持续投入,直接拉高了行业的进入门槛。

云测数据自研的数据标注平台会根据实际使用中的反馈,以每周甚至更快的频率进行功能迭代,以技术结合更多的落地场景,不断提升数据标注工具的技术含量。同时,云测数据也致力于通过工程化开发来减轻数据标注中的重复劳动,提升业务效率。

基于自建的数据标注基地、场景实验室、全职的标注团队和硬实力的技术投入,云测数据的业务场景已经覆盖智能驾驶、智慧城市、智能家居、智慧金融、新零售等多个领域,全品类服务能力、独立第三方的身份和对数据隐私安全的严格把控,让众多 AI 企业和各个行业的龙头企业选择与云测数据合作,保持着长期良好的关系。

“在工作过程中我们会对员工擅长的领域进行分类,比如有的员工更擅长视觉领域的数据标注工作,而有的员工对图像、语音有偏好。我们会根据这些分类,制作教材,对员工进行深度的指导和培训,帮助他们进行知识储备和专业程度的提升。”

专业的团队以及系统化的学习,加上领先的技术工具实践,为云测数据的数据标注工作带来稳定且高效的价值助力,这也成为云测数据与其他数据服务商在数据标注精准度上拉开距离的一大利器。

行业发展:人工智能的发展需要“技术+人”的力量

人工智能在落地应用中有一个天然的矛盾:AI是是线上“轻经济”,而数据标注则更像一个传统的“制造业”。从科技发展的角度,许多人会觉得或许将来数据标注的工作也会被机器代替,但这种讨论被部分业内人士类比为“到底是先有鸡还是先有蛋”的问题。首先,人工智能的发展得益于对数据的有效标注。我们身处的世界在不断发展前进,新的知识不断产生,人工智能想要应用新的知识,那必然需要人工智能训练师的训练。比如现在人工智能在自动驾驶、智慧金融和智能家居等等领域有了深度发展,但在专业门槛较高的医疗领域,因为缺乏顶尖的医疗数据标注人才,难以进行高效、准确的数据标注,成为了抑制智慧医疗发展的一个“绊脚石”。

从细分结构来看,随着AI技术的不断成熟,更多的场景和行业开始嵌入使用AI技术,AI行业应用场景逐渐趋于长尾和碎片化,产生了大量新兴垂直领域的数据需求;从AI应用迭代、用户体验完善的角度来看,AI应用需更贴合具体使用场景的数据进行迭代更新。

不仅如此,就拿现在热门人工智能落地的具体应用来说,AI还没有完全释放出它的价值。随着AI应用产品落地,未来AI对数据的要求只会越来越高”。云测数据认为,在我们可以预见的未来,数据标注可以被提速,但人的意义却无法被替代。只要人工智能技术继续发展,数据标注领域就是一个永无止境,不断学习不断吸取新内容的AI支柱型行业。

免费获取Testin云测产品体验

立即咨询