爱数智慧致力于为人工智能提供数据解决方案,推动人工智能技术的应用和发展。爱数智慧曾于2017年初获得明势资本Pre-A轮投资。
近日,《The Silicon Review》(硅谷评论)杂志发布2020年度30家成长最快的科技公司榜单,明势资本早期项目「爱数智慧」入选。爱数智慧曾于2017年初获得明势资本Pre-A轮投资。
《The Silicon Review》杂志总部位于美国新泽西州,专注于发掘、报道全球各领域的创新公司。作为技术行业备受推崇的刊物,它致力于分享由知名和新贵提供商开发的创新企业解决方案,其读者群包括首席执行官、首席信息官、首席技术官和IT专业人士。
《The Silicon Review》杂志中提到语音交互是全球范围内增长最快的市场之一。在应用人工智能技术的实际场景中,语音交互界面通常用于智能设备,提供类似于人的服务,将语音转换为书面或视觉信息,以及提高通信效率。这些功能的实现是基于模型和算法的训练与大量匹配场景的语音数据,数据是语音驱动的人工智能技术发展中的关键。
以下是采访部分内容截取:
Q: 如何从数据的角度提高语音识别的准确性?
张晴晴:从机器学习的本质来看:数据是机器学习的基础,标注后的数据被称为“机器学习的教材”。我们已经采集了大量多语种多场景的数据集,可以帮助用户快速提高语音识别模型的性能。
数据的相关性是影响模型在特定领域和特定场景下识别准确率的重要因素。比如,车载娱乐信息系统需要车载环境下录制的数据集来训练。我们会详细分析客户的数据需求并根据其应用场景推荐更相关的数据。
基于对行业和应用场景的洞察,爱数智慧有一套实用的数据标签体系。在标注中,我们根据不同场景和应用为数据提供不同的标签,提高数据的机器可读性。
Q: 尽管语音识别已经能够准确识别出大部分英语单词,但是对于人名和俚语依然有困难。如何降低有限词汇对语音识别结果的影响?
张晴晴:OOV词汇的识别是语音识别无法忽视的一个痛点,因为自然语言本身就是不断进化的。我们致力于通过人机协同的方式来帮助客户解决OOV的问题。我们研发了具有自主知识产权的发音词典标注系统。在这套系统中,机器可以基于现有的词典,对新词的发音进行预测,并将结果反馈给标注员。这样标注员可以更快的进行标注,并将此发音加入到词典中。通过这样的方式,我们可以快速的对词典进行更新迭代,从而加快OOV的解决。
此外,语音是被模型需要大量的数据来学习新单词。我们为各种语言提供了大规模的发音词典和相应的语音数据集,并设计了多种语料库。
Q: 如何应对数字转型的“永不停息的变化”?
张晴晴:数字化转型的本质是,在数据+算法定义的世界中,以数据的自动流动化解复杂系统的不确定性,优化资源配置效率,构建新型竞争优势。数字化影响着社会治理、企业运营、生活服务等方方面面。因此,数字化转型也需要政府、企业、行业组织等协同发力。
数字化帮助企业更容易做出理性决策。因为数字化让业务场景互联互通成为可能,使得企业可以将决策所需的信息(业务、场景、流程)集成在信息化的平台上。
数字化帮助企业采集了大量数据,如何利用数据变得更为重要。企业自发采集的数据具有多源异构的特点,很难发挥价值,爱数智慧为客户提供数据清洗、分类、标注等服务,将数据结构化。企业以结构化后的数据为原材料,可以开发出更多创新的产品,满足消费者快速变化的需求。
Q: 你们有什么新的服务准备推出吗?
张晴晴:我们的产品和服务是紧跟市场和技术的变化的。随着BERT模型的发布,NLP领域将迎来里程碑式的改变。针对NLP领域的文本处理,爱数智慧将会开发一套专门的SaaS系统,采用人机协同的方式帮助各行各业的客户在文本分析领域更快的构建数据集。