清华智谱团队提出MathGLM 可执行复杂算术运算

2023-09-19

智东西9月19日消息，据机器之心报道，上周，清华大学、TAL AI Lab和智谱AI的研究者联合提出了一个可执行复杂算术运算的新模型MathGLM，采用基于Transformer的仅解码器架构，并使用自回归目标在生成的算术数据集上从头开始训练。该研究称，在足够的训练数据下，20亿参数的语言模型能够准确地进行多位算术运算，准确率几乎达到100%，且不会出现数据泄露，这个结果大幅超越了GPT-4和ChatGPT。

论文地址：

https://arxiv.org/pdf/2309.03241v2.pdf

项目地址：

https://github.com/THUDM/MathGLM#arithmetic-tasks

清华大学