第391章【智能平板推出在即】（2 / 3）

严重的缺陷，那就是其产生的对话内容往往没有什么意义，大多数情况对现实世界没有常识和基本知识，局限于感知领域，此外，对于当前的语境往往给不出恰到好处的特定回复。”

李淳胜点点头，认同的说道“对，例如‘我不知道’确实是一个可以回答任何问题的答复，但是不够详细。大数据显示，当前版本的小蓝产生这种回复的频率比人类要高很多，因为这种回复可以覆盖很多可能的用户输入。”

罗晟让人打开了会议室里的大屏幕，然后连接自己的工作电脑，一番迅速操作便示意与会的所有人看向大屏幕。

“这是一个端到端的神经对话模型，可以学习如何对给定的对话上下文做出响应，训练小蓝的目标是最大程度的减少困惑度。以及预测下一个标记的不确定性。其核心为evolvednrr seq2seq架构，也就是通过进化神经架构搜索发现一种transforr体系结构，可以改善困惑度。”

罗晟调出一组新的信息面板，补充道“小蓝由et编码器和13个et解码器组成，编码器用于处理对话语境，帮助小蓝理解对话中已经说过的内容，解码器则是利用这些信息生成实际的回复。”

与会的一位ai技术研究员凝视着大屏幕里的面板信息自言自语的说道“通过超参数调整后，性能更强的解码器是实现高质量对话的关键。”

罗晟看向那位研究员干脆利落的点名“很好，这一块你来搞定。”

“好的老大，但我需要权限。”

罗晟点点头，在自己的电脑上敲打了几下“授权了。另外这是一个有着52亿参数的端到端神经对话模型，值得注意的是，困惑度，这是一个很容易在各种神经对话模型中实现的计算指标，这里有一份数据。”

众人一听再次看向会议室里的大屏幕。

罗晟说道“困惑度指标。由于人类评价存在的问题，一个能够自动计算的评价指标很重要，这个指标需要能够和人类评价精确对应。这里有8个不同的模型版本，分别有着超参数和架构上的区别，如层数、注意力head数量、训练步数。用的还是et，还是一般的transforr，从这份数据来看，越低的困惑度模型有着更高的得分，两者的相关系数很强。”

研讨会议并没有持续太长的时间，坐在这里的都是一群高智商的开发者，罗晟也不是一个拖泥带水的人，迅速敲定各大环节，技术团队也就进入下一个开发进程当中。

按照既定的计划，罗晟带领团队继续通过改进算法、架构、数据和计算量去降低神经对话模型的困惑度。

罗晟在蔚蓝海岸实验室滞留了两个多小时便回到了自己的办公室，并且把姚建鸿喊来。

……

“罗总，有什么吩咐？”

姚建鸿进入了罗晟的办公室，后者放下手头的工作，琢磨了片刻便说道“智能平板即将推出，技术问题基本上已经搞定，现在就差内容配套要跟上了。你去办几件事情，第一件事情给维基百科捐助1000万美元，这里的海量数据我们需要获取，另外就是准备10亿美元与全球的顶级学术期刊、大学合作，获得他们的知识库授权，最晚两个月搞定。”

除了这些，还需要更多的数据授权，罗晟当然不会放过蓝星科技庞大的数据库资源了，不过也不能白给，虽然两家公司都是自己创建的，但是蔚蓝海岸依然的向蓝星科技购买数据。

这里大约需要30亿美元的样子，然后获得在线翻译的接入权限，打通这一环节，完成整合。

姚建鸿点头“没问题，交给我吧。”

教育辅助工具“智能平板”项目是蔚蓝海娜公司上半年的重点推出的新产品。

罗晟补充道“另外在额外准