【资料图】
南方财经全媒体记者江月 上海报道7月7日,在上海举行的世界人工智能大会启幕,国产芯片也急需在大模型训练和推理中显身手。在大模型发展的核心三要素中,算力起到底座作用,国产芯片能否撑起国内大模型的发展需求?
国产CPU设计商天数智芯董事长兼CEO盖鲁江向南方财经全媒体记者表示,该公司的通用型GPU(GPGPU)已跑通接近500个大模型,其中覆盖多款主流模型。他还表示,大模型企业对算力需求与日俱增,模型参数也在持续升级,因此将在产品上针对性地对算法进行硬件级优化,以便满足国内大模型发展的算力需求。
在国内,不少互联网大厂、创业型公司等在自制人工智能大模型。获得算力,也就是买到或租用到合适的GPU,可谓这项工程的“第一步”。GPU市场的大部分份额目前为海外厂商所占据,而国产GPU设计商仍在寻求与其进行技术竞争,从而给大模型开发商提供更丰富的选择。
据盖鲁江介绍,天数智芯旗下通用型GPU“天垓100”,目前已经跑通了清华大学的GLM、Meta的LLamA、北京智源研究院的Aquila等大模型。此外,智源研究院的650亿参数大模型,也正在天垓100上进行训练,预计10月可以完成。盖鲁江还表示:“如果有一部分客户从国外的云平台迁回来,急需算力,我可以联合我的合作伙伴给他们搭建算力平台,来支持他们的开发。”
据该公司数据,截至2022年底,天数智芯累计订单接近6亿元,并在当年确认收入2.5亿元。这反映该公司量产的产品已经进入市场。
盖鲁江称,天数智芯重视国际主流软件生态,希望方便客户在API接口层面兼容国际主流终端,并降低迁移成本。“在500多人的研究团队中,软件人员的数量是硬件人员的2倍。”盖鲁江称,他指唯有做好软件优化,硬件性能才有可能呈几何倍数增长。
提及对未来的展望,盖鲁江表示一是要准备好应对国内大模型从“千卡集群”向“万卡集群”升级,二是将联手数据中心做好云平台建设。
盖鲁江指出,天数智芯目前已经和国内主流的服务器厂商完成了服务认证。这意味着天数智芯将以自身GPU搭载主流CPU,加载在第三方服务器上完成联合出货。谈及未来云平台中需要更多数量的GPU,盖鲁江也指出,chiplet和3D封装技术可以成为技术升级中的考虑选项。
面对国内客户或将迁移平台,盖鲁江希望能在此过程中与客户达成更好的互信。“GPU开发商需要客户开放更多底层数据,才能做好软、硬件优化。”他称。
标签:
据中国石油北京项目管理公司官微消息,2023年6月7日,网络出现公司所属
旗袍,中国和世界华人女性的传统服装,被誉为中国国粹和女性国服。虽然其定义和产生的时间至今还存有诸多争议,但它仍然是中国悠久服饰文化
7月21日,北京市政府发布《北京市电影局关于在疫情防控常态化条件下有序推进电影院恢复开放的通知》,宣布全市低风险地区影院,可于7月24日
武汉7·16渡江节组委会14日发布公告,由于长江武汉关水位超警戒水位,按照规定取消2020年第46届武汉7·16渡江节。受近期持续强降雨影响,
过去一段时间,国家级非遗项目灰塑传承人邵成村,多次在陈家祠等工作现场,向身边那些带着好奇目光的人们讲解灰塑的种种技术细节:草根灰、
7月13日,位于璧山区南门唐城夜市街区的璧山冷酒夜市开街。这是璧山区打造夜间经济消费载体、培育夜间经济活动品牌的举措之一。璧山市民一