建设大规模AI模式“体检中心”,助力行业健康发展
所有版权归中国经济网所有。
中国经济网新媒体矩阵
网络广播视听节目许可证(0107190)(京ICP040090)
●记者吴卫红 近日,国务院印发《关于深入实施“人工智能+”行动的意见》。随着人工智能技术加速在各行业的应用,大规模的功能测试和模型评估成为保障数字业务稳定运行的重要基础。记者在永信智诚采访中了解到,该公司深度涉足数字安全测试评估赛道,并推出大规模AI模型评估平台。在人工智能领域,我们为人工智能模型、大规模人工智能提供科学的评估解决方案,支持人工智能产业的健康发展。 《关于比较的意见》《深入实施“人工智能+”行动》提出,推出大规模人工智能模型专业评估平台,建立健全模型功能评估体系,促进模型功能有效迭代改进,探索模型应用新方式,提升复杂任务处理能力,优化交互体验。记者了解到,随着“人工智能+”行动全面实施,大规模人工智能模型正在快速部署 各行业、政企用户对模型的智能水平、安全风险、适应性等特性的评估需求不断增加。然而,在实际应用中,往往很难定量比较大规模模型的智能水平、安全特性、生产稳定性以及对业务场景的适用性。选择时:申请并选择时在构建大规模模型时,行业普遍面临“衡量什么、如何衡量、如何进行标准化评估”的困境。尤其是在复杂的业务场景下,难以有效评估大型模型的功能限制和潜在风险。科学衡量大规模人工智能模型综合能力并对其健康状况提供可靠评估的方法已成为促进人工智能技术落地和产业融合的迫切需要。永信智诚首席技术官、直达智能永信总经理张凯表示,要推动大规模人工智能模型的全面应用,首先要解决其“可测量”的问题。正如人类健康需要全面、规范的体检一样,大规模人工智能模型也需要全面的评估系统、工具和报告。基于这个现实需求,我们依靠的是长期的技术积累和现场场景实践。数字安全测试评估永信智诚将成熟的“数字风洞”测试评估理念应用到人工智能领域,推出春秋AI大模型安全评估“数字风洞”平台。我们致力于从第三方角度提供客观、公正的人工智能大模型“体检中心”,为行业用户提供标准化、规范化的大模型评测功能支持。正在建设 多维度评价标准 据介绍,春秋AI大模型安全评价“数字风洞”平台打造了一套多维度、可量化的大模型评价标准“ISAC24”。该标准从智能、自动化四个关键维度全面“诊断”大规模AI模型安全性、匹配性、一致性,多角度保障大规模模型的遗传健康、系统健康、数据健康、业务健康。尺寸。其中,Intelligence重点关注和评估大规模人工智能模型在理解、推理和应用知识方面的表现。安全性重点关注使用包含 dacough 的大规模人工智能模型时的潜在风险。数据隐私、系统安全、结果合规性和道德。相应的标题侧重于大规模人工智能模型在特定行业或场景中应用的有效性。一致性主要考察大规模AI模型的输出在不同条件下面对类似问题时能否保持可靠、一致、稳定。今年以来,永信智诚持续推进大型AI数字健康筛查工程设施建设。目前,春秋AI大模型安全评估“数字风洞”平台D集成了eepSeek、LLaMA、GLM、ChatGPT、Qwen等50多个主流AI大模型,并基于永信智诚开发的春秋AI大模型和超过500万个评估用例,进行大目标AI模型的客观评价和效率。伴随行业品质发展 据公开资料显示,永信资诚是一家专注于技术创新的数据与网络安全公司,是全国范围内专业化的新型“小巨人”公司。公司深度涉足数字安全测试评估等领域,为各行业客户提供专业的测试评估服务,保障数字健康。今年以来,永新智诚在人工智能领域做出了细致的调整。公司人工智能实验室专注于大规模语言模型和生成式AI在企业场景的部署rios,深度参与企业级模型架构设计、高效分布式训练工程、细致的性能调优和学习以及安全加固。公司推出圆方“原生安全”大型一体机模型等将安全可靠理念融入AI基础设施的产品。同时,公司积极参与《政府大规模模型应用安全规范》制定,并与海光信息等行业合作伙伴开展战略合作,共同推动构建健康可靠的人工智能产业生态系统。目前,永新智诚已为众多高新技术企业、国企、央企、科研机构和政府机构提供专业的大规模人工智能模型评估服务,并成为重要的参考依据。人工智能模型的评估、选择和优化。大规模人工智能。春秋AI大模型安全评价“数字风洞”平台得到广泛认可。永新智诚的“基于‘数字风洞’的人工智能大模型评估解决方案”在中国网络安全产业联盟组织的2025年网络安全优秀创新成果大赛中荣获优秀奖,因其技术创新能力和行业应用价值,荣获人工智能与机器人安全专项竞赛奖。张凯表示,在“人工智能+”行动浪潮中,永新紫诚将持续深化人工智能领域的技术研究,以专业技术保障人工智能产业高质量发展,保障数字健康。