金星
作者: 365bet体育投注 点击次数: 发布时间: 2025-07-07 19:14

编者注:最近,Qiming Venture Capital的投资业务工程学系教授兼电子工程系教授兼电子工程系主任Wang Yu教授在第一次魔术开发者会议上发表了主题演讲。他回顾了当前端端大型模型的开发面临的主要矛盾,并为在模型级别,软件级别和硬件级别上提出了硬核软件和硬件协作的途径。他专注于行业的发展,指出该侧设备不再仅仅依靠云来推理,并且可能已经能够完成更复杂的任务,从而为诸如体现的智能和自主驾驶等场景提供了更好的解决方案。 Wang Yu教授还分享了未来情报的方向以及需要参与的两条主要途径,以形成下一代智能基础架构数据。官方微信帐户Qiming Venture Capital经许可复制。 Wang Yu教授,Tsinghua University的电子工程系教授兼主任和Wuwen Xinqiong发起人,最近在北京开设了魔术开发商的第一次会议。会议以“模型能力导致跳跃,开放资源驱动力的变化”为主题,结合了包括来自领先的全球大学,研究机构和技术公司的一千多名代表。 Wang Yu教授是Tsinghua University的电子工程系教授兼主任和Qiming的风险投资Wuwen Xinqiong Initiator,被邀请参加会议,并发表了主题演讲,并以“副业智能智能的下一站:硬件Innovation Innovation Innovation Innovation:Hardware Innovation:Hardware Innovation:Hardware Innovation and Technallication Broughthers and Technical Broughthers and Endercebers”和“挑战”。语音作为一种基本方法进行了柔和而困难的合作,体现了智力作为未来的poINT的锚点,重点关注扩展大型结局模型的挑战和解决方案,并系统地展示了从挑战到卓越成就的终端AI的全景。 Wang Yu教授始于AI 2.0期间末端智能的快速发展,指出当前大型模型的当前发展面临重大矛盾:大型云端模型的持续扩展创造了一个较大的空间,具有有限的计算能力。同时,传统的芯片技术面临物理局限性,硬件开发的速度远非符合上升的模型,而系统的崩溃解决方案是立即的。基于这一点,王·尤(Wang Yu)教授提出了一条坚强而软协作的道路,以打破僵局。在模型级别上,小型模型是通过整合计算,数据和开发人员社区资源的力量来开发的。例如,Megrez-3的终端全模式大型大型B-Omni is jointly launched by Wuwenxinqiong and Modai community that deeply integrates software and hardware that helps optimize during the R&D process, achieving a good balance of precautions and accuracy, and achieving best industry performance at that time in the same graphic, text, text, text, text, text, text, text, text, text, text, text, text, text, text, text, text, text, text, text, text, text, text,文本,文本多远程任务。在软件级别上,有必要为一般方案开发软件。以Wuwen Xinqiong Mizar智能终端加速推理引擎为例,该引擎是一个独立且受控的大型软件模型和硬件适应平台,用于智能终端,例如PC和计算框。它的理解速度显着提高了各种应用情况的速度,并大大减少了电力消耗和记忆使用,这确实改变了E中AI的能力末端装置的nd源性。在硬件级别上,有必要依靠过度的加速器和新的设备/新计算的能量和处理速度。例如,由Wuwen Xinqiong自发开发的特殊推理的大型模型LPU IP处理器支持大型多模式模型,例如Wenshengwen,Wensheng Pictures,Wensheng Video等,并且可以支持3D堆叠的DRAM,并且可以在低功能/低计算的FPG中使用计算效率,并且可以使用计算效率高,并且能够高高地计算出效率。通过优化“算法 - 软件 - 架构Ktura-process”的协作,它在国内外的基本芯片大大领先,并在末端大型模型的性能和能源效率方面取得了重大提高。 Wang Yu教授说,在AI 2.0期间,模型的知识密度将继续增加。通过预先培训的小型模型和轻量级技术GIE,可以构建能够终端小型型号的4O/O1,并且可以将模型尺寸降低到3-13B,以适应最终设备的硬件资源限制。对于Pan-Downside上应用程序方案的大规模数字模型,未来需求将超过100tokens/s,以满足实时应用程序的需求。这种开发的趋势表明,侧设备不再仅依靠云来推理,并且可能能够完成更复杂的任务,从而为诸如体面的智能和自主驾驶等场景提供更好的解决方案。鉴于未来,Wang Yu教授认为,未来情报的方向可能包括情报和腐败的小组。体现的情报通过在实际系统中部署和运行并实现环境互动来改变实际生产力的决策技巧;小组的情报通过理解的合作全面地提高了系统能力感知,决策和实施空间。因此,下一代智能数据基础架构的开发需要两个主要途径:一个是优化电源计算的基础架构,以便每个人都可以在计算,支持研究和行业发展方面获得力量;其他人则是促进数据基础架构并支持硬件,以支持未来的新兴智能发展。 Wang Yu教授强调:“优势情报的未来是学术和工业界的目标。只有在改变硬件和算法突破时,封闭的循环才能真正释放改变物理世界的潜力。”