移动互联网

AI写高考作文,才是真的大材小用了

2023/6/9 23:25:00

2023年高考刚结束,“AI考生”的答题热情却迎来新的高潮。

6月7日,随着各种“高考”话题一起登上热搜的还有“AI写高考作文”。

高考题目一出来,我们就从数学、语文、英语三大学科对讯飞星火、ChatGPT和各家模型进行了高考真题对比测试。

先上结果:


语文作文因为主观性和随机性,几位老师测评结果不一,但讯飞星火名列前茅;在英文测试中,ChatGPT和星火显著领先其他家;在更考验思维逻辑的数学测试中,讯飞星火正确率50%,超过ChatGPT和其他各家模型,排名第一。

这时我们才发现,一个月前讯飞星火的发布会上,科大讯飞董事长刘庆峰说的“星火在文本生成、知识问答、数学能力三大能力上已超ChatGPT”,绝非虚言。

这时我们才发现,一个月前讯飞星火的发布会上,科大讯飞董事长刘庆峰说的“星火在文本生成、知识问答、数学能力三大能力上已超ChatGPT”,绝非虚言。

以语文为例,我们先向“讯飞星火”进行了提问:2023年全国高考甲卷的作文题目是什么?并分析一下它传递的意义。

没想到“星火”不仅知道刚出炉的作文题,甚至连题目背后的意义都理解的透彻。

不得不说,AI大模型是懂中国高考的,但是好的裁判就是好的选手吗?我们继续测试,让讯飞星火根据今年的全国甲卷作文“人·技术·时间”写一篇作文。

看来星火不仅是技术流,也是实践派,讯飞星火的这篇作文算是优秀范文了。

不止作文,我们喂给讯飞星火英语、数学等高考题目后,其展示出来的能力也是相当惊人。一道颇有难道的函数多项选择题,讯飞星火也是秒算结果。

距离星火大模型发布只有短短一个月,现在科大讯飞又发布了“讯飞星火认知大模型”V1.5,还推出了星火助手中心和星火APP等创新产品,同时星火大模型在教育、办公、工业、医疗等领域的进一步商业落地成果也被逐一展演。

星火大模型是怎么做到后发先至的?

一 讯飞星火的自进化

一个月前,科大讯飞在发布“讯飞星火认知大模型”时,给出了年内持续升级的明确里程碑:

第一个里程碑如期兑现,那实际效果如何?

发布会现场,升级后的讯飞星火在开放式问答、多轮对话能力、数学能力等方面都表现出色。现场真机实测的互动环节,大模型的精彩回答,让人眼前一亮,现场充满笑声和掌声。

首先是“开放式知识问答”取得突破。

在写给高考结束的孩子的暖心信里,星火不仅引经据典,更是写的很有“人”情味,确实有点暖心。

第二是多轮对话能力再次升级。

我们通过一个异想天开的童话故事开头,然后中间不断打断星火,加入一些“奇葩”的情节,星火都能自圆其说,最后生成一个有情节有逻辑的故事。

第三是,数学和逻辑能力再升级。

无论是考验逻辑能力的“三人两对父子”。

还是考验计算能力的“直角交叉线”,讯飞星火的表现都很优秀。

为什么做大模型的很多,讯飞星火迭代的这么快?


做好大模型需要很强的技术门槛,而科大讯飞是有先发优势的。贵为“人工智能第一股”的科大讯飞从1999年诞生时就有AI基因。

2011年承建语音及语言信息处理国家工程研究中心;2012年开发“讯飞语点”;2014年发布“讯飞超脑”,要实现机器从“能听会说”到“能理解会思考”;2017年获批承建认知智能全国重点实验室;2022年发布“2030讯飞超脑计划”,提出要让“懂知识、善学习、能进化”的机器人进入每一个家庭。

2022年12月,科大讯飞正式启动“1+N”认知大模型专项攻关,2023年5月就正式上线了“讯飞星火”。

可以说,正是因为有了十几年的厚积薄发,才有了我们看到的讯飞星火上线就破发的亮眼表现。

二 To C,星火给每个人一个AI助手

科技的每一次进步都能够激发人类的热情。

无论是汽车、电脑还是智能手机,从概念到大规模普及,所需时间越来越短。ChatGPT发布仅2个月用户就已经过亿,技术阶跃和快速进化让AI在全球掀起热潮。

未来“智能涌现”的AI很可能会像手机电脑一样,成为人们生活、娱乐、工作的刚需。

智能手机激发了移动互联网,认知大模型也正在改变我们获取和发布信息的方式。

发布会上,科大讯飞推出了“星火助手中心”和“星火APP”。

前者依托语言理解升级,打造了覆盖工作及生活丰富场景的200+个快捷助手,有五大板块、24个应用场景,从职场到日常生活,让人们对“AI助手”从想象开始变成现实;后者则通过手机端的交互体验提升,让“大模型”福利全家桶都“装进手机”随身携带,提供一键式解决方案。

我们实测了讯飞智聘模拟面试,提出“我是一名即将毕业的大学生,我想面试产品经理的岗位。”讯飞星火立即在线呈现了一场教科书般的面试交锋,这对需要面试演练的毕业生和职场人非常实用。

可以预见的未来,我们只需滑动手机,周报邮件、策划方案就能信手拈来,朋友圈的吸睛文案、给爱人的暖心情话,都不再需要斟字酌句的“冥思苦想”。

讯飞星火“1+N”模式下,“智能涌现”曙光出现,开始赋能千行百业。星火认知大模型在学习、办公等C端领域的商业落地成果也同步发布。

在基于星火认知大模型的AI学习机爆火后,“星火语伴APP”千呼万唤始出来,这是一款大模型赋能的AI口语助手,是1对1口语陪练,而且还有“虚拟人”更加拟真的对话。

教育本身具有很强的交互性,而星火大模型可以利用其自然语言处理能力和深度学习算法,分析学习者的发音、语调、语速、语法等问题,提供针对性训练,帮助使用者提高口语和听力水平.

科大讯飞的这个“口语老师”也不是单调的AI机械发音,更像一位真实的“老师”在与学生有趣的对话,有了这样的老师,相信高考的听力也不再是什么难事。

而对于外贸等需要跨语种沟通的行业,星火语伴更是一位随身携带的翻译,支持9种语言,支持图片、文字、语音等多模态,让语言不再是沟通的障碍。

AI给打工人的福报还不止如此,“讯飞听见智慧屏产品”更是让开会不再卷。

打工人“苦开会久已”,这款大模型赋能的会议室超级智能终端,有“讯飞听见会写”功能加持,一诞生就占据会议室的“C位”,不仅可以自动提炼会议纪要,还能智能化处理会议内容,自动生成待办事项,让长会变短会、异地会变视频会,大大提高了会议质量与效率。

有了大模型的未来办公,再没有996,人类上四休三,加班的事留给AI 。

消费者也对AI赋能的产品产生了极大的兴趣。

今年618期间,科大讯飞C端品类实现了“618开门红”,大促首日开售仅7分钟销售额就超去年同期全天,前28小时销售额更是实现同比增长109%。其中讯飞AI学习机、讯飞智能办公本、讯飞智能助听器系列、讯飞翻译机系列以及录音笔系列等产品,还“集体”斩获京东与天猫双平台单品类开门红销售额冠军。

看来,AI的发展不仅是“智慧涌现”,更是“价值涌现”。

三 To B,是大模型的新商业秩序

尽管C端应用很火热,但大模型的本质仍是一款生产力工具。

在大模型赛道上,ToB根基越扎实的玩家,能更好地拥抱大模型。反之,没有ToB基因的玩家,则有可能在大模型浪潮中迷失亦或是产生割裂。

科大讯飞之所以敢不断加码大模型,除拥有丰富的C端场景外,更源于B端的企服底蕴。

这次发布会上,讯飞星火在医疗、工业等领域的商业落地成果发布再次印证了这一点。

医疗是民生之需,健康是民生之本,AI能给医疗带来什么呢?

早在2017年,科大讯飞就承建了认知智能国家重点实验室,从这一年起,科大讯飞让机器在全球首次通过了国家职业医师资格考试、超过了96.3%参加考试的医生,而AI能做的远不是考试这么简单的事。

在星火认知大模型发布之初,就有人提问:“星火能像医生一样照看患者诊后康复吗?”现在,答案也终于揭晓。

基于大模型的“医疗诊后管理平台”发布会上官宣,这让我们看到更人性化、个性化的医疗全流程管理,将专业的诊后管理和康复指导延伸到院外,有望对“出院即脱管”的医疗困境说不,探索患者从离院到居家康复的全流程管理。

同时,随着数字经济成为推动中国经济增长的主驱力,作为数字经济发展“新引擎”的工业互联网,也因为大模型而发生变革。

早前,科大讯飞董事长刘庆峰就透露了一些大模型对工业场景的赋能。

在他看来,讯飞星火具备构建工业场景的智能化底层能力,通过“听视嗅触味思”的多模感知,解决设备管理、安全检测、节能降碳等问题;还能充分利用企业现有数据资产,构建企业级知识库及决策体系,培养出具备“聪明大脑”和“敏捷双手”的数字员工。

这次发布会上,星火大模型+工业互联网平台成果也被展现,已经实现企业在“产、供、销、服、管”等各流程的知识学习与AI赋能,有效助力了企业的降本增效。

讯飞星火的这场发布会,展现了“讯飞星火认知大模型”上线后,通过“用户参与+算法优化”实现的大模型快速升级迭代成果,也展现了科大讯飞在认知智能领域业界领先的技术水平和快速迭代能力。

AI市场是一座待开发的金矿。

入局的玩家们,有的将AIGC视作赚钱的金子,作为服务于特定诉求的工具;有的则想找到打开金矿大门的钥匙。

在这场淘金热里,是挖到金灿灿的金子直接变现,还是给挖矿的人卖铲子赚更多人的钱?

讯飞星火的回答是,All in 。



版权声明
本文仅代表作者观点,不代表贝塔立场。本文系作者授权贝塔专栏发表,未经许可,不得转载。
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。

扫一扫,或长按识别二维码

关注贝塔网官方微信公众号