阿里研究院近日发布了关于AI发展与治理的十段观察。据了解,自阿里巴巴集团宣布AI战略后,阿里研究院协同内外生态,逐步探索AI最前沿,并记录了AI大模型发展轨迹中的重要观察。
首先是提升数据供给的规模和质量,让大模型底层更坚实。数据作为大模型预训练的基础,它提供了大模型所必需的知识和信息,数据的质量、规模和多样性直接影响大模型的性能。
可以预见,正因为大模型训练高度依赖高质量数据,各地方在探索数据市场建设的过程中,尤其在公共数据授权运营和开放方面,将可能看到政府与社会力量的协同,包括社会力量参与大模型公共数据集开发与运营,科研机构有偿贡献公开数据等。
另外,AI持续进化带来计算范式革命,AI驱动算力升级,公共云将成为生成式AI算力的主旋律,成为支持AI产业创新的战略性平台。在AI大模型时代背景下,云计算技术的发展正经历一场深刻的变革。
AI大模型对计算能力提出了前所未有的挑战与需求,这一挑战正在触发计算模式的根本性革命,即从传统的以CPU为核心的计算体系架构逐步向依赖GPU主导的高效能AI加速计算转变。随着ChatGPT等创新产品引领生成式AI迈入一个崭新的发展阶段,全球云计算服务提供商面临着前所未有的增长机遇,有望借此构建全新的业务增长极。
同时,大模型开源与闭源,没有优劣之分,要找寻技术与商业的平衡点。大模型企业基于过往科技规律与底层商业逻辑,而抉择开源还是闭源路线。从产业实践观察,企业通过选择开源模型,可以提升其下游业务的灵活性、规模化优势以及数据安全可控能力等。
可以预测,虽然开源模式可能成为未来的主流,但在特定垂直场景中,闭源模型仍具有其独特的优势和应用价值,闭源模式仍将占据一定的市场份额。
推荐阅读: