大模型资讯:
英伟达二季度 H100 AI GPU 出货量或达 900 吨,约 30 万块
研究机构 Omdia 透露,英伟达在 2023 年第二季度H100 显卡的出货量为 900 吨。
Omdia 尚未说明为何以重量的形式披露出货量,有媒体推测其从供应商那里获得了发货数据。Omdia 认为,一块 H100 显卡的重量大约是 3 公斤,可以推算出英伟达在第二季度卖出了大约 30 万块 H100 显卡。

AMD 推出面向开发人员的 Ryzen AI 软件预览版
据 Toms Hardware 报道,面向开发人员的AMD Ryzen AI 软件预览版现已正式发布,支持搭载了 AMD Ryzen 7040U、7040HS 系列的电脑。
Ryzen AI for Windows 是该公司基于 Zen 4 微架构的 Ryzen 7040 系列 APU 中内置的一个硬件单元。AMD 的 Vitis AI 为人工智能推理提供了强大的工具集,可与 TensorFlow、PyTorch 和 ONNX 等流行框架无缝集成。
为了优化硬件部署模型,AMD 提供了专门的量化工具。

SoftBank 计划对OpenAI进行巨额投资
据 infotechlead 报道,在 ARM IPO 获得成功之后,软银正考虑对 OpenAI 进行巨额投资。
据报道,软银CEO 孙正义正在计划向 AI 领域投资数百亿美元,其潜在投资对象中,就包括 ChatGPT 的母公司 OpenAI。软银还希望与 OpenAI 建立广泛的战略合作伙伴关系。
波兰一公司宣布聘请 AI CEO,可实现24小时在线
据 businessinsider 报道,波兰饮料公司 Dictador 聘请一位 AI 机器人担任首席执行官一职,它将实现全天24小时在线工作。
这位机器人CEO名为Mika,是 Dictador 实验性CEO,它的工作范围包括寻找潜在客户以及选择为饮料设计瓶子的艺术家。Mika 可以做到全天在线,每周工作七天,每天24小时。
据Dictador欧洲总裁Marek Szoldrowski表示,Mika 不会解雇她的员工,因为 Dictador 公司的重大决策将由人类高管做出。

阿里通义行业大模型著作权获批
天眼查App显示,近日,杭州阿里云飞天信息技术有限公司“通义行业大模型平台”软件著作权获登记批准,当前版本号为V1.0。
此前在今年4月,阿里云通义千问开启邀测,仅一个月就有超20万企业和机构用户申请接入通义千问测试。目前通义千问大模型已首批通过备案,正式向公众开放。
目前,OPPO、得物、钉钉、淘宝、浙江大学等已与阿里云达成合作,基于通义千问训练自己的专属大模型或开发大模型应用。
百度文心一言软件著作权获批
天眼查App显示,近日,北京百度网讯科技有限公司“文心一言软件” 著作权获登记批准,当前版本号为V1.0.0。
据悉,文心一言为百度AI语言模型,在今年3月上线开放测试,并在8月31日正式开放。百度官方平台数据显示,文心一言开放首日,共计回复网友超3342万个问题。
重点论文:
清华联手微软,发布提示词优化框架 EvoPrompt
据 HuggingFace 报道,清华大学近日联手微软和Northeastern University等机构,推出一款新的框架EvoPrompt,可用于优化提示词。
研究团队表示,EvoPrompt 借鉴了进化算法的思路,能够快速处理离散提示。研究团队将大语言模型和进化算法相结合,让EvoPrompt可以同时获得大语言模型的语言处理能力和进化算法的高效优化性能。
试验显示,EvoPrompt 的性能显着优于人工设计的提示和现有的自动提示生成方法。
论文地址:点此前往
0 条评论
请「登录」后评论