书生·浦语

来自站长百科
跳转至: 导航、​ 搜索

书生·浦语(InternLM) 是上海人工智能实验室、商汤科技及高校合作发布的大语言模型,是在过万亿token数据上训练的多语言千亿参数基座模型。它通过多阶段渐进式训练,展示了在中英文阅读理解、推理任务等高难度场景下的出色性能,并在多种面向人类设计的综合性考试中取得了突出成绩。

书生·浦语不仅拥有强大的知识理解能力,还通过了大规模的语料库训练和微调过程,使其能够在与人类对话时响应复杂指令并符合人类的道德与价值观。新一代的书生·浦语2.0版本强调了其200K超长上下文的支持能力和20B版本综合性能的全面领先地位。

功能特点[ ]

多语言能力[ ]

书生·浦语拥有强大的多语言理解和生成能力,特别是在中文和英文任务上。它在多种语言的客观评测中都表现出了优于社区开源模型的性能,能够在多语言环境中被广泛应用,为不同语言背景的用户提供服务。

推理与代码能力[ ]

通过在各种来源以及精选的高质量数据上进行训练,书生·浦语展示了在逻辑推理、代码生成以及遵循复杂指令方面的卓越性能。这证明了模型不仅仅是一个简单的语言生成工具,还能够进行深度思考和问题解决,特别是在编程和技术相关的领域内。

考试性能[ ]

书生·浦语模型的学习能力进一步通过人类设计的综合性考试得到了验证。书生·浦语在包括 MMLU(Multi-task Multi-language Learning Evaluation)和 C-Eval(Chinese Language Evaluation)在内的多个评测集上展现了优异的成绩,尤其在中文考试项目中,它取得了超越 ChatGPT 的分数,彰显了其深厚的语言理解和应用能力。

超长上下文支持[ ]

书生·浦语2.0能够处理长达20万字的上下文,这使它能够在极长的文章中找到特定信息,类似于在“大海捞针”。这种能力在 LongBench 和 L-Eval 等评测中得到了验证,模型在这些长文任务中的表现达到了开源模型中的领先水平。

工具调用能力[ ]

书生·浦语新版模型的工具调用能力整体得到升级,它能够更可靠地支持复杂智能体的搭建,有效地进行多轮工具调用,完成较为复杂的任务。

发展历史[ ]

  • 2023年7月,书生·浦语正式发布。
  • 2023年9月,上海人工智能实验室联合多家机构推出书生·浦语大模型200亿参数版本InternLM-20B,并在阿里云魔搭社区(ModelScope)开源首发。
  • 2024年1月,书生·浦语2.0正式开源。

相关条目[ ]