Mistral-Nemo-Instruct-2407是由Mistral AI和NVIDIA联合训练的大型语言模型(LLM),是Mistral-Nemo-Base-2407的指导微调版本。该模型在多语言和代码数据上进行了训练,显著优于大小相似或更小的现有模型。其主要特点包括:支持多语言和代码数据训练、128k上下文窗口、可替代Mistral 7B。模型架构包括40层、5120维、128头维、1436隐藏维、32个头、8个kv头(GQA)、2^17词汇量(约128k)、旋转嵌入(theta=1M)。该模型在多种基准测试中表现出色,如HellaSwag(0-shot)、Winogrande(0-shot)、OpenBookQA(0-shot)等。
数据评估
关于Mistral-Nemo-Instruct-2407特别声明
本站趣搜呀提供的Mistral-Nemo-Instruct-2407都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由趣搜呀实际控制,在2025年1月23日 04:30收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,趣搜呀不承担任何责任。
相关导航
简化编码任务的ChatGPT提示生成
代悟
专为开发者设计的AI搜索引擎,提升搜索效率。
Lamatic.ai
构建、连接和部署边缘上的GenAI应用
NotesGPT
AI驱动的语音笔记应用,将语音转换为有组织的摘要和清晰的行动项。
olmo-mix-1124
大规模多模态预训练数据集
Llama3-ChatQA-1.5-8B
一款基于NVIDIA技术构建的高级对话问答和生成模型
Raply.AI - ChatGPT Email Assistant AI
AI助手,优化和简化电子邮件沟通
Fish Speech
语音合成工具,提供高质量的语音生成服务
暂无评论...