GPT-4能考过CET-4吗?谨防AI学术造假引热议

“GPT-4能考过CET-4吗?”面对《证券日报》记者的发问,ChatGPT做出如是回答:“GPT-4并没有被设计用于参加像CET-4这样的语言水平测试。不适合将GPT-4的语言能力与通过CET-4所需的语言技能进行比较。”

在文心一言正式发布的前夕,北京时间3月15日凌晨,ChatGPT开发商OpenAI发布了全新的多模态预训练大模型GPT-4.对于GPT-4的应试能力,ChatGPT虽表态谦虚,但已有案例表明,尽管OpenAI并没有针对部分考试进行专门培训,但GPT-4的排名依然名列前茅。例如,GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。


(相关资料图)

GPT-4在应试能力领域的优秀表现也引发市场对于AI学术造假的担忧。《证券日报》记者在与多家AI行业上市公司相关负责人的沟通过程中了解到,如何避免AI学术造假已经成为备受业内关心的难题。

多模态大模型渐成趋势

据国盛证券披露研报显示,GPT-4实现了以下四个方面的飞跃式提升:强大的识图能力;文字输入限制提升至2.5万个单词;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。国盛证券方面认为,GPT模型是当下全球AIGC的标杆,谷歌、AWS、百度、阿里、腾讯均在加快通用AI的进场步伐。

深度科技研究院院长张孝荣对《证券日报》记者表示:“多模态的大模型已经成为一种趋势,GPT-4已经从3.5版本的单模态升级为多模态大型语言模型,数据来源得到指数级提升,进一步增强了大数据分析能力和文字输出能力。”

“GPT-4相比GPT-3拥有更大的模型训练、更好的上下文理解、更广泛的语言覆盖和更好的训练技术等,使得在自然语言处理和语言交互任务上表现更好,应用场景将更加广泛。”天使投资人、中国电子商务专家服务中心副主任郭涛对《证券日报》记者表示。

在郭涛看来,GPT-4将在AIGC、客服服务、信息查询、医疗健康、在线翻译、文化教育、游戏娱乐、在线咨询、家庭陪护等领域快速落地,推动行业创新变革,并有望形成万亿元级的市场规模。

值得一提的是,GPT-4发布后,ChatGPT概念股3月15日开盘活跃,随后迅速低走。截至当日收盘,ChatGPT指数下挫1.48%。这引发了市场对于文心一言直面GPT-4竞争的猜测。

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林在接受《证券日报》记者采访时表示:“GPT-4一经发布,支付渠道就出现了拥堵,用户热情是足够的,这也就意味着当前OpenAI实际上没有商用落地的忧虑,这款产品已经可以实现变现,识图的多模态模型的应用前景也非常广泛。对标国内产品,我国大模型生成式AI亦能打开广阔的市场前景。但同时需要注意的是,生成式AI的路径需要覆盖大规模算力、高质量数据、百亿级参数等一系列的积累。”他建议,国内企业切勿因友商自乱阵脚,仍需打好基础,一步一个脚印方能做出成绩。

业内热议AI学术造假难题

“据说现在在美国90%的作业都是AI完成的,现在大学都在禁止使用ChatGPT”“如果在国内推广类ChatGPT产品,第一个需要注意的就是防止学生用它来完成作业、论文”……随着GPT-4在应试能力方面越来越强,在语言表达和语义识别方面愈加灵活,如何识别和避免通过AI技术进行学术造假引发热议。

“有内容生成,就有内容对抗”。某不愿具名的AI上市公司相关负责人告诉《证券日报》记者,面对如何检测学术造假、内容造假等问题,其所在的上市公司正在加码对于内容对抗等新业态等方向的研发。

针对AI学术造假的难题,另有上市公司相关负责人告诉《证券日报》记者,新技术宜通不宜堵,尽管该上市公司并未着手准备对AI内容对抗技术的研发,但由技术革新引发的问题终将由技术革新解决。

奇安信方面相关负责人则认为,解决人工智能问题的核心仍然是人。在该负责人看来,网络安全的本质是攻防两端人与人的较量,再先进的科技,都需要人来使用、人来控制、人来确保安全。无论是实战还是演习,每场较量中人都发挥了引领驱动的作用。

值得注意的是,在内容分析领域,GPT-4还可能引发更大的挑战。张孝荣对记者强调,GPT-4为市场带来的一个重要的挑战是GPT-4在公开情报分析方面具备较强能力。这个能力远远大于搜索引擎,也超过了许多NSA数据武器。目前来看,GPT-4解决了多模态问题,因此无论音视频、图片还是文字,GPT-4都能够进行解读。“如果你要分析互联网大数据的秘密,并且发现需要的情报,那么GPT-4这样的机器人就会很有用处。”

(文章来源:证券日报)

关键词: