钉钉x昇腾:用AI一体机撬动企业数字资产智能化

“走红”近两年后,大模型正在加速走进千行万业。

由于大模型的主要模态是文字和图片,恰好是数字化办公最基础的内容要素,办公于是成了离AI最近的场景。

公文写作、表格生成、提炼大纲、文本翻译、代码润色、数据统计、智能问答……越来越多的应用正在办公场景落地,曾经需要几个小时才能处理的工作,现在被压缩到了分钟级乃至秒级。

特别是进入2024年后,大模型tokens窗口扩张使得百万字的无损上下文输入成为现实,衍生出了阅读论文、搜索网页,在海量资料中进行信息整理和分析的新应用场景。AI智能不断涌现,要么加入AI,要么被AI淘汰,成了“打工人”茶余饭后的谈资。

不过,要把AI接入办公场景,也存在一定问题:面对效率和安全,企业该何选择的问题?

不少企业多年经营,留存下了大量的数字资产,涉及内部知识、技术文档、经验分享、财务数据、业务订单等等,可以说是一家企业“核心竞争力”的源泉。AI存在一定安全风险,一旦泄密,对于企业来说,无疑是“自毁长城”。

既要保障数字资产的安全,也想用AI激发出新动能。比较主流的做法是本地化部署,即将大模型部署到本地服务器上,在数据不外漏的前提下,用大模型盘活数字资产,向智能技术要效益,向私有部署要安全。

理想很丰满,现实却很骨感。大模型走进企业,需要一系列软硬件支持。摆在企业面前的就是安全、性能和成本的“不可能三角”:在算力成本高企的背景下,数据安全常常对应着海量的成本投入;不想在硬件上投入太大,性能不可避免大打折扣。

面对办公AI的“拦路虎”,钉钉和昇腾给出了新的解法:日前举办的HC2024昇腾产业峰会上,联合发布了“钉钉专属AI一体机解决方案,通过软硬件的深度协同,加速企业智能助理落地。

01 本地化部署的“三重门”
之所以会出现“不可能三角”,根源在于AI在办公场景落地时普遍出现的三类痛点:

一是数据安全疑虑。

随着越来越多的业务走向数字化,企业数据在终端、应用云端、数据中心间流转,链路非常复杂,导致数据要素的流通风险激增。再加上大模型的“黑箱”问题,数据一旦投喂给大模型就无法“撤回”。

早在2023年4月,三星就曝出了数据泄露事件。半导体部门的工程师使用ChatGPT修复源代码问题,导致内部会议记录等数据以提问的方式上传到了ChatGPT的训练数据库。美国数据安全公司Cyberhaven曾统计160万员工使用AI的情况,发现3.1%的“打工人”曾直接将公司内部数据喂给ChatGPT分析。

所以很多企业对数字资产智能化的策略是:内网部署、进行物理层隔离,从模型、数据、应用等全方位保障企业数据内容安全。

二是成本和不确定性。

本地化部署的代价也很明显,涉及算力、运维、模型微调等一系列流程,并且存在极大的不确定性。

以算力基础设施为例,需要解决CPU、GPU、内存、网络等一连串挑战,单单是基本的硬件投入,就需要数十万以上的预算。如果要实现长文本阅读等高算力场景,意味着百万级、千万级的算力成本。

大模型的微调和部署,同样是成本开支的大头。2023年大模型刚走红时,模型定制开发的价码一度达到上千万,即使是行业回归了理性,也需要上百万的费用。另一个不应该被忽略的是,市面上的主流大模型往往保持着按月更新的节奏,不断有新的能力被挖掘,每一次版本更新后都需要重新适配。

三是缺乏落地经验。

拥抱AI是战略层面上的,落地应用则是战术层的。在战略上做出正确选择很重要,但战术上的挑战一点都不少。因为大模型的落地应用是一个不断试错的过程,存在时间周期长、落地成本高的特征。

目前的技术距离通用人工智能还有不小的距离,大模型的能力可以应用到哪些业务场景中,需要一个个去尝试,再根据业务场景的实际表现进行调整测试。何况还存在“懂不懂行”的争论,开发者不懂一线员工的需求,一线员工不懂AI,无形中产生了种种内耗,制约着AI的落地进程。

办公AI的落地不单单是一个技术问题,也是一个工程问题,智能化的能力和行业应用经验一个都不能少。

以上种种问题,既是行业内普遍存在的现象,也是钉钉和昇腾合作的出发点。双方联合给出的解题思路正是“钉钉专属AI一体机”,在昇腾Atlas 800I A2推理服务器的使能下,能提供从算力、模型、数据库到Agent应用开发和场景部署的一站式一体化落地解决方案,让AI的落地企业,不再是复杂的系统工程,而是开箱即用的服务。

02 “1+1>2”的协同效应
面对希望快速落地大模型应用、数据安全敏感度高、担心成本大的企业诉求,钉钉和昇腾能否给出最优解?

在回答这个问题前,不妨先了解下钉钉的AI探索。

截至2023年,已经有2500万组织、7亿用户使用钉钉。隐藏在数字背后的,恰恰是钉钉在办公领域的全场景布局,涵盖协作、沟通、知识等高频场景,不仅意味着钉钉对企业办公场景需求和痛点的深刻洞察,也让钉钉拿到了AI时代的“入场券”,探索大模型在办公领域的应用前景。

可以找到的动作有很多。譬如2024年初的新品发布会上,钉钉把焦点留给了AI Agent,用户只需要简单配置,即可实现智能问答、图像生成、内容创作、数据统计等能力。

过去的大半年时间里,以钉钉为底座的AI产品和方案不断涌现,从底层的大模型,到RAG、混合云部署在内的学习调优,再到简单高效的Agent创建和深入知识、人事、市场、销售、产研等不同场景的Agent应用,其中就包括针对企业数字资产的专属AI解决方案和智能应用。

比如面向数据资产的ChatBI,可以用自然语言随时随地查询经营数据,实现了“所想即所见”的高效率;
比如面向知识资产的ChatMemo,先让大模型学习专业文档、融合图谱与向量,即可提供专家级回答;
再比如面向应用资产的ChatForm,配合宜搭的无代码搭建能力,拖拉拽就能打通数据,创造智能应用……
不难得出这样的结论:钉钉的方案和能力可以满足企业数字资产向智能要效益的绝大部分需求。有了这种被千万组织、数亿用户验证过的,办公AI本地化部署方案,企业AI转型就不再需要从0到1“重复造轮子”。

而深耕AI框架、算子、计算架构、网络等根技术的昇腾,接棒了高性能算力、高能效硬件、智能运维等基础设施。

在硬件方面,钉钉专属AI一体机搭载的昇腾Atlas 800I A2推理服务器,支持百亿级LLM大模型推理,并可以面向中心规模部署,实现保障业务SLA要求下的最大有效输出。

在软件方面, MindIE推理引擎提供针对大模型的推理、训练,可以提供通信加速、解码优化、量化压缩、调度优化等能力,全方位保障钉钉专属AI一体机的模型推理性能。

其中在14B-70B大模型的推理场景下,钉钉专属AI一体机的W8A8量化压缩比W8A16提升了40%,通过HCCS多级通信优化,绝大部分模型的吞吐平均性能达到了友商的1.5倍。

同样的,还有白屏化部署功能,在大模型的部署过程汇总,用户无需关注背后的技术复杂性和操作细节,而是在图形化的界面上一步步点击、配置、安装,大幅降低了模型部署的门槛,让企业更方便地接入。

钉钉的大模型和场景优势,遇到昇腾的底层软硬件能力,碰撞出了1+1>2的“协同效应”:从硬件到软件的深度协同优化,帮助企业快速、高效、稳定地落地大模型应用,加速生产、销售、研发、管理等环节迈向数智化, “一键”挖掘企业数字资产的价值。

03 联手打破“不可能三角”
最后必须回答的问题是:钉钉专属AI一体机都有哪些落地场景,能够给企业带来什么样的价值?

我们找到了一些真实的落地案例。

第一个是知识助理。

钉钉专属AI一体机对企业的产品资料、技术文档等进行学习后,扮演起了“销售助理”的角色,帮助销售人员快速整理产品资料,以对话的方式对比不同型号产品的差别、解答产品的应用场景,进一步提高销售人员的工作效率。

衍生出的场景还有很多。比如面向售前的智能导购,根据消费者的描述和需求,筛选推荐最适合的产品;再比如销售陪练,以陪练的方式对新入职的销售人员进行水平测验,迅速成为“老司机”。

第二个是管理助理。

过去有出差需求时,需要先提交出差申请,通过后人事预订机票和酒店,整个过程至少需要三四个小时。现在可以将相关权限下放给AI助理,只需要语音描述出差的时间、地点,即可自动完成机票和酒店的预订。

以及困扰无数职场人的会议室预订,需要和每一个参会人员沟通时间,然后在OA平台上逐个查看哪个会议室是空着的。有了AI助理后,只需要确认参会人员名单,就能根据大家的日程安排自动预定会议室和会议时间。

第三个是生产助理。

在生产制造环节,一个普遍问题是操作人员的不规范,常常需要人工指导监督,其实可以在AI的指导下,帮助生产人员明确生产流程的具体操作,严格遵循质量控制标准,保障生产过程的合规和高效。

相似的还有智能检修场景,在AI的辅助下按照正确的步骤进行故障排查,结合历史维修记录快速判断故障点,甚至是获得故障预测和解决方案,通过经验和知识的快速复用,提高设备的检修效率。

可以看到,钉钉专属AI一体机的落地场景并未局限在公文写作、表格生成等简单场景,深入到了销售、管理、研发、生产、维修等企业生产运作的每一个环节,而且在每一个环节都释放出了新的价值。

也就是说,曾经阻碍AI本地化部署的“不可能三角”,以“降维打击”的方式被消除了,并且迸发出了源源不断的新质生产力。

把视角再放大一些的话,诸如此类的合作远不止办公。

仅仅是在不久前举办的华为全联接大会2024上,华为就与科大讯飞、交通银行、钉钉、360在内的21家伙伴和客户,基于昇腾AI基础软硬件平台联合发布大模型推理行业解决方案,覆盖了互联网、金融、政府、政务、制造、媒资、交通等行业。

另一个不应该被忽略的信息点在于,在“开放、利他”的理念下,昇腾AI已累计培养3万多名原生开发贡献者,2000多家应用伙伴孵化了4000多个行业解决方案……言外之意,钉钉专属AI一体机等产品的想象空间远未触顶,将不断被赋予更多的能力和价值。

04 写在最后
年初的时候就有不少人预言:2024年将是大模型推理元年。

回头来看,预言不仅得到了充分验证,还出现了此前未曾料到的“奇迹”。在钉钉专属AI一体机等产品的帮助下,AI打破了数据安全、成本、落地门槛高等重重阻力,让AI Agent在越来越多行业生了根、发了芽。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/885389.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

JavaScript类型转换和相等性详解

类型转换 10"objects" //10objects,数字10转换为字符串 "7"*"4" //28,两个字符串均转为数字,只要不是加,其他都按两个数字算 var n 1-"x"// NaN,字符串x无法转化为数字 n"objects"//…

大模型训练:K8s 环境中数千节点存储最佳实践

今天这篇博客来自全栈工程师朱唯唯,她在前不久举办的 KubeCon 中国大会上进行了该主题分享。 Kubernetes 已经成为事实的应用编排标准,越来越多的应用在不断的向云原生靠拢。与此同时,人工智能技术的迅速发展,尤其是大型语言模型&…

通信工程学习:什么是CSMA/CD载波监听多路访问/冲突检测

CSMA/CD:载波监听多路访问/冲突检测 CSMA/CD(Carrier Sense Multiple Access/Collision Detect),即载波监听多路访问/冲突检测,是一种用于数据通信的介质访问控制协议,广泛应用于局域网(特别是以…

rpm方式安装jdk1.8

1、查询系统中是否已经安装jdk rpm -qa |grep java 或 rpm -qa |grep jdk 2、卸载已有的openjdk rpm -e --nodeps java-1.7.0-openjdk rpm -e --nodeps java-1.7.0-openjdk-headless rpm -e --nodeps java-1.8.0-openjdk rpm -e --nodeps java-1.8.0-openjdk-headless3、安装j…

考拉悠然携手中国系统打造城市智能中枢,让城市更聪明更智慧

在21世纪的科技浪潮中,智慧城市建设已成为推动城市现代化进程的重要引擎。随着人工智能技术的飞速发展,AI正以前所未有的速度融入智慧城市管理的每一个角落,从交通出行到公共安全,从环境保护到城市管理,无一不彰显着智…

2.1 HuggingFists系统架构(二)

部署架构 上图为HuggingFists的部署架构。从架构图可知,HuggingFists主要分为服务器(Server)、计算节点(Node)以及数据库(Storage)三部分。这三部分可以分别部署在不同的机器上,以满足系统的性能需求。为部署方便,HuggingFists社区版将这三部…

生产环境升级mysql流程及配置主从服务

之前写到过mysql升级8.4的文章, 因此不再介绍mysql的安装过程 避免服务器安装多个mysql引起冲突的安装方法_安装两个mysql会冲突吗-CSDN博客 生产环境升级mysql8.4.x流程 安装mysql 参考之前文章: 避免服务器安装多个mysql引起冲突的安装方法_安装两个mysql会冲突吗-CSDN博客…

尚硅谷MyBatis笔记

Mybatis简介 MyBatis历史 MyBatis最初是Apache的一个开源项目iBatis, 2010年6月这个项目由Apache Software Foundation迁移到了Google Code。随着开发团队转投Google Code旗下,iBatis3.x正式更名为MyBatis。代码于2013年11月迁移到GithubiBatis一词来源于“intern…

yolov8/9/10模型在仪表盘、指针表检测中的应用【代码+数据集+python环境+训练/应用GUI系统】

可视化训练系统 可视化应用系统 yolov8/9/10模型在仪表盘、指针表检测中的应用【代码数据集python环境训练/应用GUI系统】 背景意义 随着科学技术的快速发展,机器视觉以及人工智能等技术逐渐从理论走向实践,并在各个领域得到广泛应用。机器视觉检测系统…

使用powershell的脚本报错:因为在此系统中禁止执行脚本

1.添加powershell功能环境: 2.启动powershell的执行策略 因为在此系统中禁止执行脚本。 set-executionpolicy unrestricted

若依生成主子表

一、准备工作 确保你已经部署了若依框架,并且熟悉基本的开发环境配置。同时,理解数据库表结构对于生成代码至关重要。 主子表代码结构如下(字表中要有一个对应主表ID的字段作为外键,如下图的customer_id) -- ------…

springboot 集成 camunda

项目地址: stormlong/springboot-camundahttps://gitee.com/stormlong/springboot-camunda 官网集成引导 进入官网 https://camunda.com/ 选择 camunda7 滑倒页面底部 进入 getStart 页面 https://start.camunda.com/ 点击 GENERATE 下载导入 idea 即可 流程设计…

水波荡漾效果+渲染顺序+简单UI绘制

创建场景及布置 创建新场景Main,在Main场景中创建一个plane物体,命名为WaterWavePla,具体数值及层级面板排布如下: 编写脚本 创建一个文件夹,用于存放脚本,命名Scripts,创建一个子文件夹Effect,存放特效相关脚本,创建…

grafana全家桶-loki promtail收集k8s容器日志

loki是grafana旗下轻量级日志收集工具,为了减少loki对集群的影响,把loki的agent日志收集端promtail部署在k8s集群中,loki server部署在集群外面。这样简单做一个解耦,避免大量读写的应用影响到集群内业务服务。 一、promtail部署…

Transformer算法7个面试常见问题

1.Transformer为何使用多头注意力机制?(为什么不使用一个头) 英文论文中是这么说的: Multi-head attention allows the model to jointly attend to information from different representation subspaces at different position…

1.1.5 计算机网络的性能指标(上)

信道: 表示向某一方向传送信息的通道(信道!通信线路)一条通信线路在逻辑上往往对应一条发送信道和一条接收信道。 速率: 指连接到网络上的节点在信道上传输数据的速率。也称数据率或比特率、数据传输速率。 速率单…

(二)大模型调用

一、基本概念 1.1、Prompt 大模型的所有输入,即,我们每一次访问大模型的输入为一个 Prompt, 而大模型给我们的返回结果则被称为 Completion。 1.2、Temperature LLM 生成是具有随机性的,在模型的顶层通过选取不同预测概率的预测结…

职称评审难在哪?

没有项目业绩资料? 社保不符合? 看不懂评审文件? 申报材料不会做? 论文没地发表? 有这些疑问的 评论区滴滴

[Python学习日记-33] Python 中的嵌套函数、匿名函数和高阶函数

[Python学习日记-33] Python 中的嵌套函数、匿名函数和高阶函数 简介 嵌套函数 匿名函数 高阶函数 简介 在 Python 当中函数除了能减少重复代码、扩展性强和易维护外,其实还有挺多不通的玩法的,例如嵌套函数、匿名函数、高阶函数等,它们是…

毕业论文设计javaweb+VUE高校教师信息管理系统

目录 一、系统概述 二、功能详解 1. 教师管理 2. 部门管理 3. 奖惩管理 4. 业绩管理 5. 培训管理 6. 报表查询 三、总结 四、示例代码 1 前端VUE 2 后端SpringBootjava 3 数据库表 随着教育信息化的发展,传统的手工管理方式已经不能满足现代学校对教师…