当前位置:七真书院>其他类型>沪风疆韵> 第24章 小样本学习
阅读设置(推荐配合 快捷键[F11] 进入全屏沉浸式阅读)

设置X

第24章 小样本学习(1 / 2)

“样本?就是说你要1201同本地人多交流是吗?”尹秋并没有学过这些东西,因此听起来云里雾里的,“可这样必然进入恶性循环——1201听不懂,不回应,缺乏与本地人的互动,交流减少,而越不交流,1201就越听不懂。”

1201所使用的学习方式,是比较新颖的“小样本学习”(few-shot learng)。这种样本学习方式,不仅对机器学习领域有着重大意义,也同样具有挑战性。能否从少量样本中学习和概括的能力,是将人工智能和人类智能进行区分的明显分界点。因为人类可以仅通过少量示例就可以轻松地建立对新事物的认知,而机器学习算法通常需要大量的有监督样本来保证泛化能力。

但由于隐私,安全性等一系列因素,许多现实的场景,例如医学,军事等领域,根本无法收集到足够的带标签的训练样本。因此,徐远风才决定让1201使用这种尚未完善的“小样本学习”(few-shot learng)训练方法。

徐远风当然不会跟尹秋说这些涉及专业知识的方面,他要用更简单的方法来解释。

“样本,我需要各类方言的样本,你要知道,我们训练ai不是凭空训练的,样本非常重要。”徐远风一边解释,一边拿起纸笔,在纸上画着,好让尹秋能理解他说的话。

“比如,有些公司做的是绘画的ai,就需要将很多画作当做样本给ai做训练。”徐远风在纸上简单地画了个思维图,“而有些创作者,为了省力,他们会将自己的画作作为样本,这种行为,有些人会称为‘喂’,比如说,把自己的画‘喂’给ai,这样ai就能以你的画风来进行ai作画。”

“同样的道理,想要ai理解方言,也是需要将各种不同地区的方言,甚至于各种语速、情绪来‘喂’给ai。”

“所以你需要一个能涵盖当地各种方言,甚至各种年龄段、各种情绪的样本是吗?”尹秋听了,只是觉得这样难度过高,而且别人也不是闲的没事干,把乡亲们从日常生活中拉出来跟1201说话,怕不是要不少经费。

“我知道你在想什么,你可能觉得需要经费,但实际上不需要,因为目前这个阶段我们的数据模型只负责接受各种方言,然后进行分析就好,而不是方言方面的输出。这也就是前些天明明出了方言不能识别那种事,我还要将1201带出去测试的原因——它需要足够的积累。”

“年轻人工作重要,但身体也重要,来新疆要好好调整作息,才能劳逸结合。”阿依莎大婶站在门口,出声提醒二人,免得二人因为天还亮着就不去睡觉,导致明天工作出问题。

“好的,我们会注意时间的。”尹秋笑着回应。

徐远风伸长脖子,见大婶上楼后,小声说:

“你说大婶会不会发现咱俩的关系吧?天天交流这么多。”

尹秋感到好笑,感情没破裂那段时间,徐远风下班没事的时候恨不得黏在自己身上,现在倒还注意起影响来了?

“都说了是工作的事情,大婶不会怀疑的。”

“也是,”徐远风转向桌前,“我要写代码了,你自己玩吧。”

“哄小孩呢?”尹秋这下真给徐远风逗得笑出声了。

她转身上楼,回到自己房间。

尹秋也有事要做,经过下午的讨论与主任的拍板,他们决定拍一个宣传视频——不用航拍,也不用很高端的剪辑技巧,而是用最朴实的方法记录古城最真实的美好瞬间。

虽然朴实,但该做的事情还是要做,她需要先写出一个视频脚本。这样,不论是回头外包给其他公司还是融媒体中心自己拍都能有一个基本的参照。

提到这个,她就有些来气。

讨论的时候特意提到了视频拍摄是否要外包出去的问题,主任坚持“专业的事情让专业的人来干”,而她多年

上一章 目录 +书签 下一页