近日,由极客邦旗下 InfoQ 中国倾力打造的 AICon 全球人工智能开发与应用大会在北京举办。此次大会以“智能未来,探索 AI 无限可能”为主题,覆盖“人工智能前沿技术”、“通用机器学习技术”、“计算机视觉实践”、“智能金融技术与业务结合”、“NLP 技术与应用”、“推荐广告技术及实践”、“认知智能的前沿探索”等14 个专业技术专题,汇聚 60 位行业头部企业嘉宾,在现场分享最新 AI 技术创新和应用实践,推动大模型技术的有效落地和行业创新。

作为国内最早开始教育垂直大模型探索的代表企业,作业帮应邀参会,作业帮写作大模型成功入选中国技术力量之【AIGC先锋榜单】案例TOP20,作业帮资深算法专家蒋宏飞围绕写作大模型的技术创新和实践作了主题分享。

近年来,生成式大模型技术阶跃式发展,大大突破了机器智能的能力边界,引发了各行各业对大模型研发和应用的热情。教育行业也不例外,作业帮在早期就开始积极拥抱生成式大模型技术,在细分教育场景中深入探索创新,尝试构建在效果和体验方面具有颠覆性的新型智能教育服务。

在写作场景,以往只能依赖搜索、推荐、传统自然语言理解类技术来提供写作工具,以此来弥补学习资源紧缺和学生写作文难、需要精细化个性化指导之间的巨大服务真空。随着生成式文本大模型技术发展,在语言理解和文本生成方面取得了飞跃式突破,为精细化、个性化智能写作提供了坚实基础。但在实际落地实践探索中,仍面临诸多困难挑战。

蒋宏飞通过基座训练阶段优化适配场景、ICL技术推动推理环节、RAG 技术解决幻觉问题、反馈学习对齐用户偏好等四个维度,详细分享了作业帮在写作大模型相关领域所做的技术创新和成果突破,充分模拟真实学习场景,解决技术难题。在实际教学场景中,会紧跟课程安排根据每个单元的学习目标针对性设计习作题目。整个学习过程也会由点到面,由浅到深设计。因此,写作场景具有较强领域特殊性。

蒋宏飞举例,作业帮在写作大模型预训练和SFT阶段实践并创新出多种技术来做好写作场景适配。在面对一些较复杂需求时,也尝试借助ICL和长上下文技术,融合范文、写作指导等相关性场景知识来引导模型做更优质生成。另外,针对幻觉问题,作业帮在RAG技术方向上做了用户意图理解、多路语义检索、噪声容忍微调等优化工作。最后,作业帮写作大模型充分利用线上用户反馈数据,基于自主创新的强化学习算法,实现了闭环式用户需求对齐学习。

作业帮成立于2015年,一直致力于用科技手段助力教育普惠,运用人工智能、大数据等前沿技术,为学生、老师、家长提供更高效地学习、教育解决方案,智能硬件产品等,让人工智能技术于在线教育场景中真正落地。