大模型资讯:
英伟达将在10月15日—16日举办英伟达 AI 峰会
据英伟达官方消息,英伟达将会在当地时间10月15日—16日在特拉维夫举办 AI峰会,其CEO 黄仁勋将会在本次峰会上介绍最新的生成式 AI 和云计算技术。
据悉,为期两天的峰会将吸引来自全球最具活力的技术中心之一的2500多名开发人员、研究人员和决策者。峰会期间,将会有60多场会议举行,参会者将深入探讨加速计算、机器人技术、网络安全和气候科学等主题。
黄仁勋的主题演讲将会在当地时间10月16日上午10点举行,届时将会进行现场直播。

DALL-E 3现已向 Bing Chat 用户免费开放使用
据 ZDnet 报道,微软现已向 Bing Chat 和 Bing Image Creator用户免费开放图片生成模型 DALL-E 3。
DALL-E 3 是由 OpenAI 开发的图片生成模型 DALL-E 的最新版本,在文字理解、图片生成质量方面都比前代版本有大幅提升。据 OpenAI 表示,用户现在可以向 DALL-E 3 提出更细节的要求,并帮助他们生成细节更丰富的图片。
除了微软的 Bing Chat等应用外, DALL-E 3 还将向ChatGPT Plus 和 ChatGPT Enterprise 用户开放。
Nature 调查显示,AI 工具在科学领域正越来越常见
据 Nature 的一项针对科学家的调查显示,AI 工具在科学领域正变得越来越普遍,许多科学家预计这些工具将很快成为研究实践的核心。
Nature 采访了全球1600多名研究人员,超过半数的受访者预计这些工具将 "非常重要 "或 "必不可少"。但科学家们也对人工智能如何改变研究方式表示了强烈的担忧。有三分之二的受访者表示,人工智能提供了更快的数据处理方法,58%的人说,它加快了以前不可行的计算速度,55%的人提到,它为科学家节省了时间和金钱。

Runway 宣布与 Canva 合作,推出AI视频生成功能
据 Runway 官方消息,Runway 已与 Canva 达成合作,为其带来强大的 AI 视频生成功能。
即日起 Runway 旗下模型Gen-2 的全部功能都可以通过 Canva 的全新 Magic Media 应用程序直接访问,为 Canva 的 1.5 亿月活用户提供直接访问最佳 AI 视频生成模型的机会。
据悉,用户可以通过输入文字或上传图片来生成长达18秒的视频,该功能目前仅限付费用户使用。
StabilityAI推出Stable LM 3B语言模型
据 Huggingface 页面显示,Stability.ai宣布推出开源大语言模型StableLM-3B-4E1T。
StableLM-3B-4E1T 主要面向移动设备,是一款30亿参数的基础大模型,他可以在保证性能的同时降低算力需求。StableLM-3B-4E1T 支持文本、代码生成功能,还可以进行数学推理、文本总结等工作。
目前StableLM-3B-4E1T已经在 Huggingface 上开源。
全国首个大模型创新生态社区在上海徐汇挂牌
据界面新闻报道,上海“模速空间”创新生态社区暨人工智能大模型产业生态集聚区近日在上海揭牌。
“模速空间”是全国首个大模型专业孵化和加速载体。“模速空间”将发挥中心城区“中心辐射”功能,围绕“1+1+5+N”功能体系布局,打造开放数据平台、测试评估平台、算力调度平台、融资服务平台、综合服务平台五大公共服务平台,为入驻企业夯实要素保障;同时,面向消费、文娱、医疗、金融、教育等大模型需求转化快、先发优势强的垂直应用领域,打造若干行业级生态社区,以最高优先级政策支持,推动各类垂直场景小模型“首发首秀”。
重点论文:
麻省理工联手港中大,发布全新大模型微调方法LongLoRA
据 Arxiv 页面显示,麻省理工学院近日联手香港中文大学提出一种高效的微调方法LongLoRA ,它能以有限的计算成本扩展预先训练好的大语言模型的上下文大小。
论文显示,研究团队提出一种更简单的注意力形式策略,被称为S2-Attn,它可以有效地实现上下文扩展,从而节省了大量计算量,其性能与使用虚无注意力进行微调时的性能相似。
研究团队表示,LongLoRA已在开源模型LLaMA2 7B/13B/70B上进行了试验,将上下文原始长度扩展至32K、64K、100K,所需要的算力资源却很少。
论文地址:点此前往

0 条评论
请「登录」后评论