智东西9月19日消息,据机器之心报道,上周,清华大学、TAL AI Lab和智谱AI的研究者联合提出了一个可执行复杂算术运算的新模型MathGLM,采用基于Transformer的仅解码器架构,并使用自回归目标在生成的算术数据集上从头开始训练。该研究称,在足够的训练数据下,20亿参数的语言模型能够准确地进行多位算术运算,准确率几乎达到100%,且不会出现数据泄露,这个结果大幅超越了GPT-4和ChatGPT。
论文地址:
https://arxiv.org/pdf/2309.03241v2.pdf
项目地址:
https://github.com/THUDM/MathGLM#arithmetic-tasks
