Mistral-Nemo-Instruct-2407是由Mistral AI和NVIDIA联合训练的大型语言模型(LLM),是Mistral-Nemo-Base-2407的指导微调版本。该模型在多语言和代码数据上进行了训练,显著优于大小相似或更小的现有模型。其主要特点包括:支持多语言和代码数据训练、128k上下文窗口、可替代Mistral 7B。模型架构包括40层、5120维、128头维、1436隐藏维、32个头、8个kv头(GQA)、2^17词汇量(约128k)、旋转嵌入(theta=1M)。该模型在多种基准测试中表现出色,如HellaSwag(0-shot)、Winogrande(0-shot)、OpenBookQA(0-shot)等。
数据评估
关于Mistral-Nemo-Instruct-2407特别声明
本站趣搜呀提供的Mistral-Nemo-Instruct-2407都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由趣搜呀实际控制,在2025年1月23日 04:30收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,趣搜呀不承担任何责任。
相关导航
一个开源的IDE扩展,旨在提升AI软件开发系统的模块化和可进化性。
Gaia-ml
无需编码,快速构建神经机器翻译器
Voiser AI AI Transcriber
AI技术实现语音转文字和内容总结的应用
Art Review Generator
生成和分析艺术评论的语言工具
CodeGeeX.cn
CodeGeeX是一款基于大模型的全能智能编程助手,能够实现...
Deepthought-8B
基于LLaMA-3.1 8B的小型推理模型,实现透明可控的AI推理。
Claude Artifacts Showcase
分享你的AI创作
GitHub Copilot
AI驱动的代码补全工具
暂无评论...