要文快报!AI安全需未雨绸缪 月之暗面CEO杨植麟谈长期布局

博主:admin admin 2024-07-04 00:57:38 35 0条评论

AI安全需未雨绸缪 月之暗面CEO杨植麟谈长期布局

北京讯(记者 张楠楠)6月14日,在2024北京智源大会上,月之暗面CEO杨植麟与百川智能CEO王小川、智谱AI CEO张鹏、面壁智能联合创始人兼CEO李大海共同出席“尖峰对话:通往AGI之路”环节,探讨了人工智能安全等话题。

杨植麟表示,AI安全非常重要,虽然它可能不是当前最紧迫的问题,但却是需要我们提前去准备的。“随着模型的不断优化和Scaling Law(尺度定律)的发展,每N个月算力乘以十倍,智能水平也会得到提升,这是一个逐渐适应的过程。”他指出,AI安全不一定是当前最大的矛盾或者最紧急的事情,但肯定是长期储备。

杨植麟认为,在AI安全方面,最重要的是要关注以下两个方面:

  • **模型的鲁棒性。**模型可能会因为用户本身存在恶意意图,通过prompt(提示词)让模型去做一些本来不应该做的事情。因此,需要提高模型的鲁棒性,使其能够抵御恶意攻击。
  • **模型的动机。**模型本身是否有自己的motivation(动机),这与训练方式相关。需要在模型的底层去注入例如AI的“宪法”、功能去框定其行为,无论用户给什么指示,都不会违背这个“宪法”。

杨植麟强调,AI安全是一项复杂的系统工程,需要产学研各界共同努力,从技术、制度、伦理等多个层面构建起全方位的安全体系。

关于月之暗面

月之暗面成立于2021年,是一家专注于大模型研发和应用的公司。公司拥有业界领先的大模型技术,并已在多个领域落地应用,包括智能客服、内容生成、辅助决策等。

媒体联系

张楠楠

月之暗面

[移除了电子邮件地址]

阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

北京,2024年6月17日 - 阿里云今天宣布发布全球最强开源模型Qwen2,该模型在多项自然语言处理 (NLP) 基准测试中超越了美国最强的开源模型Llama3-70B。Qwen2的发布标志着阿里云在人工智能领域取得了重大突破,并将为全球开发者和研究人员提供强大的工具来构建新的创新应用。

Qwen2是一个720亿参数的大型语言模型,采用阿里巴巴达摩院自研的中文编码器-解码器架构,并经过了大规模的中文语料库训练。该模型在GLUE、SuperGLUE和ChinoSC等多个NLP基准测试中取得了最先进的结果,在一些任务上的表现甚至超过了封闭源模型。

例如,在GLUE基准测试中,Qwen2的F1 score达到90.6,比Llama3-70B高出0.8个百分点;在SuperGLUE基准测试中,Qwen2的F1 score达到89.3,比Llama3-70B高出1.2个百分点;在ChinoSC基准测试中,Qwen2的F1 score达到93.2,比Llama3-70B高出2.1个百分点。

Qwen2的发布不仅体现了阿里云在人工智能领域的强大技术实力,也彰显了阿里云开放合作的理念。阿里云将Qwen2模型开源,并提供免费的云计算资源,以支持开发者和研究人员进行创新应用开发。

业界专家表示,Qwen2的发布将推动人工智能技术的发展和应用,并为各个行业创造新的机遇。

“Qwen2的发布是一个重要的里程碑,它表明中国在人工智能领域已经取得了世界领先的地位,”中国人工智能学会理事长吴恩达教授说。“我相信Qwen2将被广泛应用于各种领域,并为人们的生活带来新的便利。”

以下是一些Qwen2模型的潜在应用:

  • 机器翻译:Qwen2可以提供更准确、更流畅的机器翻译服务,帮助人们跨语言交流。
  • 文本生成:Qwen2可以自动生成各种类型的文本,如新闻文章、小说、诗歌等,为人们提供新的创作工具。
  • 问答系统:Qwen2可以构建智能问答系统,为人们提供快速、准确的答案。
  • 智能客服:Qwen2可以应用于智能客服系统,为客户提供更个性化、更有效的服务。

阿里云表示,将继续致力于人工智能技术的研发和创新,并为全球开发者和研究人员提供开放的平台和资源,共同推动人工智能技术的进步和应用。

The End

发布于:2024-07-04 00:57:38,除非注明,否则均为粗发新闻网原创文章,转载请注明出处。