it之家 10 月 26 日消息,jina ai 在其官网发布新闻稿,宣布推出 jina-embeddings-v2 模型,号称是目前是唯一支持 8k(8192 个 token)上下文长度的开源产品,在功能和性能上与 openai 的 text-embedding-ada-002 类似。
在MTEB排行榜方面,IT之家发现官方做出了以下解释:
与 OpenAI 的 8K 模型 text-embedding-ada-002 进行比较,jina-embedding-v2 在分类平均值、重排平均值、检索平均值和摘要平均值方面均优于 OpenAI 的 text-embedding-ada-002
▲ 图源 Jina AI 官网
▲ 图源 Jina AI 官网
官方表示,jina-embeddings-v2 模型,是从头开始构建的。在过去的三个月里,Jina AI 团队进行了密集研发、数据收集和调整。
Jina AI 同时声称, jina-embeddings-v2 8K 的上下文长度有利于以下应用场景:
法律文件分析:确保对大量法律文本中的每一个细节进行捕捉和分析。 医学研究:为了进行高级分析和发现,全面地嵌入科学论文。 文学分析:深入研究长篇内容,捕捉微妙的主题元素。 财务预测:通过详细的财务报告获得卓越的洞察力。 会话式 AI:提升聊天机器人对复杂用户查询的响应能力。
以上就是Jina AI 推出全球首个开源 8K 文本嵌入模型,号称超越 OpenAI的详细内容,更多请关注【创想鸟】其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/1530935.html