欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智猩猩
清华智谱团队提出MathGLM 可执行复杂算术运算
2023-09-19
机器之心
13
智东西9月19日消息,据机器之心报道,上周,清华大学、TAL AI Lab和智谱AI的研究者联合提出了一个可执行复杂算术运算的新模型MathGLM,采用基于Transformer的仅解码器架构,并使用自回归目标在生成的算术数据集上从头开始训练。该研究称,在足够的训练数据下,20亿参数的语言模型能够准确地进行多位算术运算,准确率几乎达到100%,且不会出现数据泄露,这个结果大幅超越了GPT-4和ChatGPT。
论文地址:
https://arxiv.org/pdf/2309.03241v2.pdf
项目地址:
https://github.com/THUDM/MathGLM#arithmetic-tasks
清华大学

加载中...