数据是人工智能的基础。小到智能手机人脸解锁,大到智慧城市的智能安防;从车辆自动驾驶到AI聊天机器人,从医学成像与诊断到农作物监测。AI需要依据大量有效数据总结规律形成“智能”,进而在不同场景下落地应用。
“其实AI数据作为生产资料,是推动整个AI行业发展的必要一环,也是人工智能商业化的主要驱动力之一,说高质量的数据决定了AI的落地程度也不为过。”云测数据总经理贾宇航表示。
目前,场景化AI数据是人工智能现阶段发展和商业化落地的关键点。但机器并不能理解人类所能识别的原始数据,这些原始数据需要人为的“标签化”以后,才可以被用于模型训练。这些“标签化”的数据越多越精准,其获得的结果就越准确。例如,自动驾驶的算法模型经过大量场景AI数据的训练,不断的学习和优化,进而让系统的智能化程度逐渐提高。
如何“标签化”就涉及“数据标注”这一环节,即针对语音、图像、文本等数据,通过贴标签、做记号、标颜色或划重点的方式,来标注出其中目标数据的不同点、相似点或类别。
数据标注,是将数据转化为AI商业价值的重要一环。数据标注的精准度越高,AI学习和产出的结果越精确,AI也就越智能。
在场景化落地中,意味数据标注行业要满足多样化应用场景标注需求。例如,金融行业,早期对AI客服机器人的要求只停留在“用户提问后,对其中的关键词进行提取,并按照既定话术回答”。但在互联网金融业务竞争异常激烈的今天,越来越多的用户习惯在网上办理业务,AI客服机器人正在大规模地取代人工客服,AI问答的准确性将直接决定业务的效率和成本,并影响用户体验,很大程度上决定了金融机构的竞争力。(王雨阳)
相关资讯