12-09
12-09
12-09
12-09
12-09
12-09
12-09
12-09
能转化一波iPhone用户!OPPO Find X8支持iOS安卓跨端互传
12-09
腾讯发布新一代大模型“混元Turbo”:推理成本下降50% 效率提升100%
12-09
10寸屏!华为颠覆新品三折叠屏来了 六边形摄像头吸睛:引领新一轮硬件创新
12-09
AR超越VR!2024上半年中国AR市场销量激增49%:雷鸟领跑行业
12-09
ADADADADAD
英特尔,模型,至强
12-09
12-09
12-09
12-09
12-09
12-09
12-09
12-09
能转化一波iPhone用户!OPPO Find X8支持iOS安卓跨端互传
12-09
腾讯发布新一代大模型“混元Turbo”:推理成本下降50% 效率提升100%
12-09
10寸屏!华为颠覆新品三折叠屏来了 六边形摄像头吸睛:引领新一轮硬件创新
12-09
AR超越VR!2024上半年中国AR市场销量激增49%:雷鸟领跑行业
12-09
字典百科网(zdbk.com)9月5日消息,近日,第五代英特尔至强处理器,以优秀的表现通过了中国电子技术标准化研究院组织的人工智能服务器系统性能测试(AISBench)。借此,英特尔也成为首批通过AI
以下为本文的正文内容,请查阅,本站为公益性网站,复制本文以及下载DOC文档全部免费。
字典百科网(zdbk.com)9月5日消息,近日,第五代英特尔至强处理器,以优秀的表现通过了中国电子技术标准化研究院组织的人工智能服务器系统性能测试(AISBench)。
借此,英特尔也成为首批通过AISBench大语言模型(LLM)推理性能测试的企业。
在AISBench 2.0测试工具的评估下,第五代英特尔至强处理器在ChatGLM V2-6B(60亿参数)和Llama2-13B(130亿参数)两个模型上均展现了卓越的性能,能够满足轻量级大语言模型的实时推理要求。
测试结果显示,在60亿参数的ChatGLM V2模型通用推理中,当输入输出序列为256时,处理器可达每秒2493 token的性能;当输入输出序列为2048时,性能为每秒926 token。
在130亿参数的Llama2模型通用推理中,当输入输出为256时,性能为每秒513 token;当输入输出序列为2048时,性能为每秒132 token。
AISBench 2.0的测试结果,验证了英特尔至强在运行轻量级大语言模型时展现出的优异推理性能。
也使得客户可以通过基于至强的服务器,构建一个通用AI系统进行数据预处理、模型推理和部署,从而获得兼具AI性能、效率、准确性和可扩展性的组合。
同时还彰显了英特尔至强可以为企业提供“开箱即用”的功能,即可以在通用系统上部署一部分AI工作负载,从而为客户带来更佳的总体拥有成本(TCO)优势。
10-26
10-26
10-27
10-23
10-26
10-25
10-25
10-25
10-24
10-25
10-23
10-23
10-25
10-26
10-28
10-29