AI模型评测相关推荐
PubMedQA
PubMedQA是专门用在生物医学研究问题回答的数据集。PubMedQA通过文献摘要回答“是/否/可能”形式的研究问题,
H2O EvalGPT
H2O EvalGPT 是 H2O.ai 用于评估和比较 LLM 大模型的开放工具,它提供了一个平台来了解模型在大量任务
LLMEval3
LLMEval是由复旦大学NLP实验室推出的大模型评测基准,最新的LLMEval-3聚焦于专业知识能力评测,涵盖哲学、经
LMArena
LMArena是加州大学伯克利分校推出的创新AI模型评估平台,基于让用户对不同AI模型的回答进行匿名投票,衡量模型的表现
HELM
HELM是由斯坦福大学推出的大模型评测体系,该评测方法主要包括场景、适配、指标三个模块,每次评测的运行都需要指定一个场景
MMBench
MMBench是多模态基准测试,由上海人工智能实验室、南洋理工大学、香港中文大学、新加坡国立大学和浙江大学的研究人员联合
CMMLU
CMMLU是综合性的中文评估基准,专门用在评估语言模型在中文语境下的知识和推理能力,涵盖从基础学科到高级专业水平的67个
AGI-Eval
AGI-Eval是上海交通大学、同济大学、华东师范大学、DataWhale等高校和机构合作发布的大模型评测社区,旨在打造
SuperCLUE
SuperCLUE 是针对中文大模型的综合性评测基准,能全面评估模型在多个维度上的性能表现。SuperCLUE 通过多轮
FlagEval
FlagEval(天秤)是北京智源人工智能研究院(BAAI)推出的科学、公正、开放的大模型评测体系及开放平台,为研究人员
C-Eval
C-Eval是一个适用于大语言模型的多层次多学科中文评估套件,由上海交通大学、清华大学和爱丁堡大学研究人员在2023年5
Open LLM Leaderboard
Open LLM Leaderboard 是最大的大模型和数据集社区 HuggingFace 推出的开源大模型排行榜单,
AI小编推荐
openAI
OpenAI 是一家美国的人工智能研究公司,它本身并不是某一款单一工具,而是一家开发人工智能技术与平台的科技企业。Ope
ChatGPT
ChatGPT应用程序是由OpenAI开发的智能对话工具,利用先进的自然语言处理技术和大模型,模拟人类般的交流体验。用户
AgentGPT
AgentGPT 是能在浏览器中运行的自主人工智能工具。用户通过设定目标(如创建报告、规划旅行或制定学习计划等),Age
纳米AI
纳米AI是360公司推出的新一代超级AI搜索工具,集搜索、写作和创作于一体,重新定义AI搜索体验,纳米AI提供多模态搜索
GitHub Copilot
GitHub Copilot是由GitHub与OpenAI合作开发的一款革命性的智能代码补全和生成工具,旨在帮助开发人员
Cursor
Cursor是Anysphere公司推出的AI代码编辑器,通过集成OpenAI的GPT技术,为用户提供代码生成、编辑、B
Claude Code
Claude Code 是 Anthropic 公司推出的基于命令行的 AI 编程工具。Claude Code集成先进的
元气AI Bot
元气AI Bot是猎豹推出的电脑全能AI伙伴,号称国产 OpenClaw ,可在普通Windows电脑上本地运行。用户可
Meta AI助手
Meta AI助手是Meta公司推出的一款基于Llama 3模型的免费AI聊天机器人,被集成在Facebook、Inst
文心一言
文心一言(英文名:ERNIE Bot)是基于百度研发的知识增强大语言模型的AI聊天机器人,能与人对话互动,回答问题,协助
Grok
Grok 是马斯克旗下的xAI公司最新推出的人工智能助手,一个与 ChatGPT 类似的聊天机器人,关键的区别之处在于
Kimi智能助手
Kimi智能助手是北京月之暗面推出的AI智能助手,支持联网搜索能力,可实时获取最新信息结合搜索结果为用户提供准确且详细的
腾讯元宝
腾讯元宝是腾讯推出的免费AI智能助手,基于腾讯混元和DeepSeek大模型,为用户提供智能助手服务,包括智能问答、文件解
Gemini
Gemini是谷歌推出的生成式人工智能模型系列,具备强大的多模态能力,能处理文本、图像、音频等多种内容。包含多个版本,如
千问
千问是阿里云推出的全能型人工智能助手,基于强大的通义千问大模型,具备多模态交互能力,支持文本、图片、文档、音频和视频等多
豆包
豆包是字节跳动公司推出的多功能AI工具和免费AI聊天机器人,基于豆包大模型构建。豆包具备文案创作、PDF问答、长文本分析
AI灵感PPT
AI灵感PPT是一款免费高效的AIPPT生成工具,用户只需输入标题即可在30秒内获得初版演示文稿。AI灵感PPT提供主题
轻竹办公
轻竹办公PPT是由北京智未创想科技推出的一款结合人工智能技术专为PPT制作而设计的办公工具,旨在简化和加速PPT的创建过
吐司AI高清
吐司AI高清是吐司TusiArt推出的智能图片变高清/修复工具,基于Stable Diffusion、FLUX等先进模型
美图云修
美图云修是美图公司推出的专业级AI人像精修软件,专为商业摄影行业设计。软件用美图自研的先进AI算法,提供一键式全自动修图
用户评论